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第 八 章 正则 表达 式 的 应 用 
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感谢 我 的 家 人 。 是 你 们 给 与 了 我 一 切 。 无 论 走 到 哪里 ， 你 们 都 让 我 感到 温暖 和 充满 勇气 。 


| 





人 -> 


感谢 我 的 女 朋 友 : 红 梅 。 你 对 我 的 照顾 和 给 予 我 的 爱 ， 让 我 的 生命 变 得 完 
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2Eo 


























感谢 我 的 朋友 阿 满 在 百 忙 之 中 抽出 时 间 校 对 。 但 本 书 质量 应 完全 由 译 者 





























站 


所 
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感谢 出 现在 我 生命 中 所 有 的 人 人。 那些 和 我 一 起 逃学 ， 一 起 罚 站 ， 一 起 偷 邻居 甘蔗 的 伙伴 : 那些 和 我 一 起 抽烟 ， 一 起 喝酒 ， 
一 起 唱歌 候 大 山 的 同学 ;那些 天 冷 提 醒 我 穿 衣 ， 过 马路 提醒 我 小 心 的 知己 朋友 ， 还 有 那些 和 我 斗嘴 的 ， 和 我 打架 的 ， 是 你 























们 锻炼 了 我 的 口才 ， 是 你 们 强壮 了 我 的 身体 。 你 们 还 好 吗 ? 








最 后 我 想 说 : 当 你 很 饿 ， 面 对 美味 佳 看 ， 请 不 要 急于 动 答 子 ， 当 你 很 渴 ， 面 对 清 录 甘露 ， 请 不 要 急于 动 跑 ， 当 你 乱 
请 放 慢 你 的 脚步 ， 用 心 去 感受 。 


对 暖 信 热 被 ， 请 不 要 急于 动 腿 。 当 你 所 光 望 的 东西 正在 你 眼前 的 时 候 ， 


lebk 
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欢迎 使 用 小 骆驼 书 。 





从 


本 书 是 第 四 版 ， 自 93 
心急 。 








FE 以 来 ， 有 超过 50 万 的 读者 喜欢 它 。 至 少 ， 我 们 希望 他 们 喜欢 它 。 不 管 怎 样 ， 我 们 写 此 书 时 非常 开 


目 心 




































































镶 本 书 第 一 版 由 Randal L.Schwartz 著 , 第 二 版 由 Randal,Tom Christiansen 著 , 第 三 版 由 Randal,Tom Phoenix 车, 本 版 由 Randal, Tom Ponenix， 
和 brian foy 著 。 因 此 ， 在 本 版 中 ， 当 说 “我 们 ”时 ， 指 的 是 最 后 三 位 。 现 在 ， 你 可 能 猜想 ， 为 什么 在 第 一 页 就 说 写本 书 我 们 非常 开心 
《过 去 时 态 )， 理 由 很 简单 : 因为 我 们 是 从 后 往 前 写 的 。 这 听 起 来 很 奇怪 。 但 是 ， 坦 白 讲 ， 当 写 完 索引 后 ， 剩 下 的 就 变 的 很 容易 了 。 


互 
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1. 1 工 问题 和 解答 

















你 或 许 对 Perl 有 些 疑 问 ， 也 可 能 是 针对 本 书 ， 特 别 是 当 你 已 经 大 致 浏览 本 书后 。 因 此 ， 我 们 将 用 本 章 来 回答 这 些 问 题 。 


























1. 1. 1 本 书 适合 你 吗 ? 





如 果 你 和 我 们 类 似 ， 那 你 很 可 能 正 站 在 书架 前 争 ， 考 虑 是 否 要 买 这 本 羊 骆 驼 书 来 学 习 Perl 或 是 买 另 一 本 由 蛇 《〈 有 迁 回 的 
含义 )， 饮 料 ， 或 者 一 些 字母 命名 的 语言 争 的 书 。 你 站 了 两 分 钟 ， 书 店 经 理 走 过 来 通知 你 这 不 是 图 书馆 争 ， 你 要 么 买 要 么 
快 点 离开 。 可 能 ， 你 利用 这 两 分 钟 时 间 来 查看 一 个 Perl 程序 ， 来 了 解 其 强大 功能 以 及 它 能 完成 怎样 的 工作 。 如 果 是 那样 
的 话 ， 您 因 该 浏览 本 章 剩 下 的 章节 。 







































































急 实 际 上 ， 如 果 和 我 们 一 样 ， 你 因 该 站 在 








到 





书馆 ， 而 不 是 书店 。 当 然 我 们 有 一 点 将 再 。 




















急 在 你 写 信 告 诉 我 们 那 是 段 愉快 ， 而 非 迁 回 〈 伤 脑筋 ) 的 历程 之 前 ， 其 实 我 们 想 的 是 CORBA 。 





镶 除 非 它 是 ， 否 则 


1. 1. 2 为 什么 如 此 多 的 脚注 ? 




















情 ， 





感谢 你 注意 到 这 些 。 本 书 中 有 大 量 的 脚注 。 忽 略 它们 就 行 了 。 我 们 需要 脚注 的 原因 是 Perl 中 有 大 量 的 噶 常 。 这 是 好 
因为 生活 本 身 就 充满 了 意外 。 



































但 这 并 不 意味 着 我 们 不 能 老实 的 写 :“The fizzbin operator frobnicates the hoozistatic variables” 人 争 ， 而 不 写 任何 脚注 来 描述 


异常 情况 。 事 实 上 ，, 我 们 相当 老实 ， 所 以 我 们 写 了 脚注 。 但 你 可 以 老 老 实 实 的 忽略 它们 。( 这 种 解决 办 法 听 起 来 相当 有 趣 )。 
许多 异常 和 移植 性 相关 。Perl 最 早 在 Unix 系统 中 使 用 ， 因 此 它 和 Unix 渊源 极 深 。 但 只 要 有 可 能 ， 我 们 就 演示 它 非 预期 的 
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行为 ,无 论 这 种 结果 是 由 non-Unix 系统 ， 还 是 别 的 原因 引起 的 。 我 们 希望 那些 对 Unix 一 无 所 知 的 读者 也 认为 本 书 是 一 本 
好 的 Perl 教程 。〈 同 时 ， 也 能 附带 学 些 Unix 的 知识 )。 

















其 余 的 大 量 的 异常 都 和 “80/20” 规 则 相关 。 我 们 是 指 80% 的 Perl 可 用 20% 的 篇 幅 介绍 。 剩 下 的 20% 需 要 80% 篇 幅 。 为 了 
保持 本 书 的 大 小 ， 我 们 将 在 正文 中 介绍 最 常用 的 ， 最 容易 讲 明白 的 内 容 ， 在 脚注 中 介绍 别 的 〈 它 们 字体 更 小 ， 因 此 可 以 在 
相同 的 空间 内 写 入 给 多 的 内 容 ) $ 但 你 学 习 本 书 时 ， 如 果 没 有 阅读 脚注 ， 很 可 能 在 后 面 的 章节 中 需要 回 过 头 来 查看 。 如 果 
是 那样 ， 或 者 在 学 习 的 过 程 中 ， 出 于 好 奇 ， 那 就 读 读 这 些 脚注 吧 。 尽 管 大 多 数 脚注 只 是 一 些 计算 机 的 笑话 。 



















































































急 我 们 甚至 讨论 为 了 节省 纸张 ， 把 整 本 书 用 脚注 组 成 ， 但 脚注 跟着 脚注 看 起 来 有 些 疯 狂 。 






































1. 1. 3 练习 题 和 解答 呢 ? 











练习 题 在 每 章 的 末尾 。 由 于 我 们 三 人 向 几 千 人 介绍 相同 的 材料 争 。 因 此 我 们 仔细 的 选择 了 这 些 习 题 ， 让 你 更 有 机 会 犯错 。 








镶 不 是 同时 的 

















并 不 是 我 们 希望 你 犯错 ， 而 是 你 需要 这 种 经 验 。 因 为 在 Perl 生涯 中 ， 这 些 是 你 最 可 能 犯 的 错误 ， 因 此 我 们 现在 就 应 当 提 
醒 你 。 那 些 在 阅读 本 书 时 犯 的 错误 ， 可 能 不 会 在 项 目的 终止 日 期 时 重 犯 。 当 你 出 错 是 我 们 会 帮助 你 找到 错误 的 原因 ; 哈 录 
A 有 每 一 个 习题 的 解答 ， 和 小段 注释 。 当 完成 习题 时 请 检查 答案 。 







































































的 更 牢靠 。 如 果 没 有 找到 答案 ， 也 不 要 太 伤心 。 继 续 阅读 下 一 章 。 
。 解 答 的 注释 中 可 能 有 关于 这 段 程序 的 一 些 不 明显 地 方 的 介绍 。 





不 要 在 仔细 淮 试 之 前 看 答案 。 自 己 解决 比 读 解答 
如 果 你 完全 没有 犯错 误 ， 也 因 当 在 完成 时 看 下 答 






































区 
天 
条 




















1. 1. 4 习题 前 的 数字 是 什么 意思 ? 














or 





每 一 习题 前 都 有 一 个 由 中 括号 括 起 来 的 数字 ， 像 下 面 这 样 : 


























[2 习题 前 面 方 括号 中 的 数字 2 是 什么 含义 ? 


这 个 数字 是 我 们 关于 你 大 概要 花 多 长 时 间 来 解决 这 道 题 的 〈 非 常 粗略 的 ) 估计 。 由 于 非常 粗略 ， 当 你 在 一 半 或 两 倍 的 时 间 
内 完成 〈 书 写 ， 调 试 ， 测 试 ) 时 ， 也 不 必 太 惊讶 。 另 外 ， 当 被 题目 难 住 时 ， 我 们 也 不 会 告诉 任何 人 你 偷 看 了 只 孙 A。 














1. 1. 5 如 果 我 是 Perl 教师 ， 怎 么 办 呢 ? 























如 果 你 是 Penl 的 教师 ， 决 定 采 用 本 书 作为 教科 书 〈 过 去 的 年 月 里 ， 许 多 人 采用 了 它 )， 你 因 当 知道 我 们 尽力 使 每 一 组 联系 
能 让 大 多 数学 生 在 45 分 钟 一 1 小 时 内 完成 ， 其 间 有 些 休息 时 间 。 一 些 练习 可 能 很 快 就 完成 了 ， 另 一 些 也 许 花 的 时 间 要 长 
些 。 那 是 因为 ， 当 我 们 写 下 了 方 括号 中 的 数字 时 ， 我 们 发 现 不 知道 怎么 把 它们 加 起 来 。( 笠 运 的 是 ， 我 们 知道 怎样 用 计算 
机 来 做 到 )。 
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1 2 Perl 代表 什么 


Penl 一 般 被 称 为 “实用 报表 提取 语言 
(Pathologically Eclectic Rubbish Lister) 。 
展 到 第 二 个 。 那 就 是 为 什么 “Perl” 没 有 








Perl 语言 入 门 (第 四 版 ) 


忆 y 上 昌 























(Practical Extraction and Report Language )， 蛋 
已 是 术语 ， 而 不 仅仅 是 
所 有 字母 都 大 写 。 没 必要 争论 那 一 个 ] 








AAA- 亿 芝 


人 简写， 














虽然 有 时 被 称 做 “病态 折 中 垃圾 列表 器 ” 
Perl 的 创造 者 ，Larry Wall 提出 第 

















个 ， 但 很 快 又 扩 











你 也 可 能 看 到 “perl”， 所 有 的 字母 都 是 小 写 的 。 一 般 ,“Perl”， 有 大 写 的 P， 是 指 语言 本 身 ， 而 “perl”， 小 写 的 p， 是 指 





程序 运行 的 解释 器 。 


1. 2. 1 


Larry 在 80 年 代 中 期 发 明了 Perl 语言 ， 当 时 他 想 从 像 新 闻 组 
awk 语言 不 能 胜任 这 任务 。Larry， 作 为 一 个 懒惰 的 程序 员 急 ， 为 了 彻底 的 解决 这 个 问题 ， 坟 
。 这 次 努力 的 结果 就 是 Perl V0。 




















至 少 还 能 在 一 个 不 同 的 地 方 使 




















镶 我 们 不 是 无 














Larry 为 什么 


里 的 说 Larry 很 1 


发 明 Perl ? 



































g 件 那样 的 文件 中 产生 一 些 有 























贿 惰 ， 实 际 上 懒 | 


有 是 一 种 美德 。 手 推 






































的 。Perl 是 











1. 2. 2 为 什么 Larry 不 采用 别 的 


程序 语言 本 身 没 有 缺陷 ， 有 吗 





就 已 产生 ， 很 可 能 Larry 就 会 采用 它 。 他 需要 能 像 shell 或 awk 昼 
j 像 C 那样 的 语言 。 


























工具 的 强大 功能 ， 但 又 不 采 ) 














合 如 果 不 知道 它们 ， 不 ) 








担心 


Pezl 填补 了 低级 语言 (如 C，C++， 汇 编 语言 )》 和 高 级 语言 (如 shell 编 





那些 不 创造 一 种 新 的 语言 就 懒 于 完成 任务 的 人 发 明 的 。 





语言 ? 

















? 但 是 ， 在 Larry 导 




















个 时 候 ， 他 没有 找到 满足 需要 的 语言 。 如 果 现 在 的 某 种 语言 在 居 
了 样 快速 编码 ， 同 时 具有 如 grep, cut sort sed 争 等 这 些 高 级 






































。 这 些 是 Larry 的 Unix 工 上 
































但 速度 快 ， 且 无 限制 ， 高 级 语 
语言 ， 正好 相反 ， 一 般 速 度 慢 
































让 我 们 从 另 一 个 角度 来 看 关于 


第 一 ，Perl 简单 。 如 你 将 要 见 到 的 ， 这 意味 着 容易 使 用 。 但 不 是 特别 容易 学 习 。 如 果 学 习 3 








后 就 很 容易 的 开车 了 。 当 你 花 











言 ， 在 速度 上 ， 很 难 
， 困 难 ， 于 陋 ， 有 限 























Perl 的 这 四 点 : 





盒 中 的 程序 。1 


超过 书写 良好 的 低级 语言 。 
判 ， 如 果 没 有 系统 提供 的 函数 ，shell， 批 处 理 语 言 能 完成 的 工作 相当 
限 。Perl 简单 ， 几 乎 是 无 限制 的 ， 速 度 快 ， 也 有 些 丑 陋 。 





1 尼 1 























了 许多 时 间 来 学 习 Perl 时 ，Perl 对 你 来 说 就 简单 了 @ 。 





多 当然 ， 我 们 并 不 希望 你 翻车 (@)。 











Perl 几乎 没有 限制 。 几 乎 没有 什么 事 不 能 由 Perl 来 完成 。 你 一 般 不 希望 用 Perl 来 
能 完成 )。 但 针对 一 般 工 作 中 遇 到 的 问题 ， 
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由 那些 懒 于 搬 东 西 的 人 发 明 的 ;文字 是 由 


程 ) 的 空白 。 低 级 语言 通常 难于 
在 低级 语言 里 ， 你 几乎 





的 报表 给 一 个 bug 报告 系统 ， 
定 发 明 一 种 一 般 用 途 的 工具 ， 
































那么 懒 于 记忆 的 人 发 明 



































g 个 时 代 


门 还 不 能 解决 手头 的 工作 。 


























编码 ， 并 且 于 陋 ， 
能 完成 任何 事 。 高 级 
有 





























开车 ， 你 花 数 周 或 数 月 学 习 ， 然 








世 写 内 核 级 的 中 断 驱 动 程序 “虽然 Perl 
从 一 次 性 程序 到 工业 级 的 运用 ，Penl 都 能 出 色 的 完成 。 
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Perl 速度 快 。 那 是 由 于 ， 所 有 的 Perl 开发 者 都 使 
降低 其 它 程序 的 速度 ，Larry 基本 上 会 和 
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四 版 ) 

















E 绝 添加 它 除 非 找到 一 个 方法 使 它 足 够 快 。 





Perl 有 些 丑 。 这 是 事实 。O Reilly 给 Perl 的 





有 它 

















1 2. 3 Perl 容易 学 习 吗 ? 


Perl 容易 使 用 ， 但 有 些 难 学 。 























Ia 
当然 ， 这 具有 








区 | 











3 、 
[三 


-zw 








对 于 初学 者 难于 学 习 时 ，Larry 通常 倾向 于 衣 
序 员 的 时 间 。 例 如 学 多 函数 都 有 默认 值 ; 通 














代码 争 : 








镶 如 果 你 每 周 或 每 月 只 花 几 分 钟 来 使 ) 
些 每 天 至 少 花 20 分 钟 来 写 程序 的 人 。 























各 ， 


j 某 种 语言 。 你 可 能 选择 那些 容易 学 习 的 语言 ， 


j Perl， 他 们 希望 它 快 。 如 果 某 人 想 加 一 个 很 酷 的 功能 到 Per 中 ， 但 它 会 























沫 。Perl 有 些 像 它 。 








瑟 


标 是 骆驼 ， 这 种 动物 是 著名 的 骆驼 书 〈 也 被 称 为 Perl 语言 纺 
的 兄弟 -本 书 〈 它 的 姐妹 ， 羊 驼 书 〈Alpaca))。 骆 驼 有 些 丑 。 但 是 它们 努力 工作 ， 即 便 在 艰苦 的 环境 中 。 无 论 什么 
难 骆 驶 都 能 完成 任务 ， 昌 然 他 们 不 好 看 ， 不 好 闻 ， 有 时 还 向 你 吐 因 


程 ) 的 封 男 


本 

















到 









































适 性 。 设 计 Perl 时 ，Larry 做 了 学 多 权衡 。 当 遇 到 能 让 程 











这 些 默 认 行 为 就 是 你 需要 











序 员 更 容易 使 用 ， 但 
种 。 那 是 因为 ， 你 只 学 习 一 次 ， 而 将 重复 使 用 争 。Perl 有 学 多 做 法 来 节约 程 
的 。 因 此 ， 你 将 节约 学 多 时 























司 来 写 像 下 面 这 样 的 











因为 在 下 次 使 / 








镶 我 们 将 不 详细 解释 。 本 例 是 将 文件 中 某 种 格式 的 数据 ， 换 成 另 一 种 。 所 有 功能 都 能 在 本 书 中 均 有 找到 答案 。 





while(<>){ 


chomp; 


print join(CAn (SPlit //)[0,.2,1.5]) ”Nm ; 


} 








如 果 不 利 用 Perl 的 默认 值 和 简写 ， 本 段 代 码 大 约会 长 10~12 倍 ， 这 将 花 更 多 时 间 来 阅读 和 书写 。 并 
Perl， 没 有 看 见 代 码 中 的 变量 ， 那 只 是 


将 难于 维护 和 调试 。 如 果 你 懂 一 点 








员 的 负担 ， 不 得 不 增加 学 习 的 代价 ， 因 此 你 











只 上 
因 当 学 习 这 些 默认 值 和 简写 。 








j 之 前 你 不 需要 记 住 它 们 。Perl 是 给 那 




















于 有 更 多 的 变量 ， 

















| 
工 














部 分 问题 。 它 们 都 使 用 的 默认 值 。 为 了 减轻 程序 





一 个 很 好 的 类 比 ， 是 英语 中 的 单词 。 例 如 , “will nof” 和 “wontf 含义 相同 。 但 大 多 数 人 说 “won't” 而 非 “wil not”， 因 为 这 





将 节约 时 间 ， 并 且 每 个 人 都 知道 它们 有 相同 含 











言 那样 更 快 的 “说 ”出 来 ， 并 且 被 同行 

















所 理 





解 











义 。 同 样 的 ，Perl 也 把 一 些 常用 的 语句 以 一 种 更 简略 的 形式 来 表达 ， 就 像 语 


一 旦 熟悉 了 Perl， 将 发 现 比 shell 引用 《或 C 声 明 ) 花 更 少 的 时 间 ， 你 将 有 更 多 的 时 间 在 网 上 冲浪 ， 因 为 Perl 的 强大 能 
Perl 设计 成 能 让 你 仅 用 数 行 就 能 漂亮 的 解决 问题 。 你 可 以 把 这 些 工 具 带 到 下 一 份 工作 中 ， 因 为 Perl 其 








此 你 将 有 更 多 的 时 间 神 滔 。 

















Petl 是 高 级 语言 。 


写 ， 调 试 ， 维 












































的 数量 大 致 和 它 的 长 度 成 正比 争 〈 而 





镶 当 程序 超过 一 屏 时 ，bugs 数量 会 突 增 。 
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护 速度 都 更 快 。 当 整个 程序 在 一 屏 中 ， 不 需要 癌 上 向 下 滚动 查看 时 ， 编 程 将 更 容易 。 并 











有 很 高 的 移植 性 ， 因 














这 意味 着 ， 代 码 很 紧 炭 ， 通 币 Perl 程序 大 约 是 它 对 应 的 的 C 程序 的 14 到 3/4 长 。 这 使 


骨 Perl 程序 的 读 ， 














7 由 于 程序 中 busgs 

















FE 和 程序 的 函数 )， 这 就 意味 着 ， 平 均 起 来 ， 短 一 些 的 Perl 程序 意味 着 更 少 的 bugs。 
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Perl 语言 入 门 (第 





四 版 ) 





1. 2. 4 Perl 为 什么 如 此 流行 ? 


Larry 使 用 了 Penl 一 段 时 间 ， 做 了 些 修补 后 ， 把 它 发 给 新 闻 组 上 的 


这 个 那个 以 及 别 的 六 





























结果 ，Perl 持续 增长 。 它 的 特性 越 来 越 多 。 





F 多 问题 的 方法 ，Larry 从 没有 预想 过 他 的 小 Perl 能 处 理 那些 问题 。 





























移植 性 越 来 越 强 。 


曾经 的 一 门 小 语言 成 长 为 拥 
































骆驼 书 。 








1. 2. 5 Perl 正在 发 生 怎样 的 事情 ? 























有 上 千 页 在 线 文 档 ， 数 十 本 书 


户 了 ， 通 常 被 称 为 “网 上 ”。 成 千 上 万 的 用 户 问 他 ， 做 





几 个 主流 新 闻 组 《还 有 大 量 非 主流 新 闻 组 )， 每 一 天 几乎 每 个 当代 系统 上 都 有 无 数 的 读者 和 实现 者 。 当 然 ， 不 要 乐 了 这 本 小 


Larry 最 近 已 经 不 写 代 码 了 , 但 他 仍然 领导 着 Penl 的 发 展 , 并 作出 关键 决定 。Perl 主要 由 一 群 勤务 的 被 称 做 Perl 5 守门 人 (Penl 


SPorters) 维护 。 你 可 以 在 perl$-porters@perlLorg 中 查看 他 们 的 工作 进 


AI 











5 中 。 


2000 年 ，Larry Wall 
们 的 视野 但 并 没 
的 Pugs 〈Perl User 


http:/www.pugscode. 

















我 们 写 做 此 书 时 (2005 年 3 月 ),Perl 已 经 发 生 了 许多 变化 。 在 过 去 的 几 年 中 ， 许 多 人 都 忙于 下 一 个 主 
不 要 把 你 的 Perl 5 扔 到 一 旁 ， 前 最 新 和 最 稳定 的 版 本 。 我 们 并 不 期 望 Perl 6 的 稳定 版 本 会 入 


出 现时 ，Perl $ 也 不 会 


几 国 
灰 Z 











展 和 讨论 。 


























要 版 本 : Perl 6。 














因为 它 仍 是 当 
消失 , 几 年 之 内 , 许多 人 将 

















全 之 


与 。 








第 一 次 提出 了 下 一 个 主要 版 本 是 Perl 社 自 





区 对 Pezl 的 导 





























Golfing System)。 来 自 全 球 的 Perl 和 Haskell 开发 者 提 


阿 





快 出 现 。 当 Perl 6 


同时 使 用 这 两 个 版 本 。Perl 5 的 维护 者 经 常 把 Perl 6 中 的 好 点 子 加 到 了 Pen 


以 后 ， 一 个 新 的 解释 器 "Parrot "就 进入 人 
响 到 普通 用 户 。 今 年 〈2005 年 )， 唐 宗 汉 (CAutrijus Tang) 开始 利用 Haskell 实现 作为 轻 量 级 的 Perl 6 
供 了 帮助 。 在 http:/devperLorg/perl6 和 














org/ 中 可 以 了 解 到 更 多 信息 。 





1. 2. 6 Perl 擅长 什么 ? 





Perl 擅长 写 那 些 需要 在 短 时 间 内 完成 的 程序 。 对 于 那些 需要 数 十 个 程序 员 ， 人 花费 数 委 


























更 多 的 情况 是 你 将 写 那些 从 开始 构思 到 实际 测试 代码 只 需 几 十 分 钟 的 程序 。 


Perl 被 设计 为 : 90 儿 处理 文本 ，10 儿 针对 其 它 情 况 。 这 种 能 力 基 本 上 能 满足 当今 的 编 
























































懂得 每 


Berners-Lee 还 没有 web 的 丝毫 想法 ， 但 它们 是 互联 上 的 完美 联姻 。 许 多 人 声称 90 年 代 初 Perl 的 发 
网 上 传输 ， 而 没有 内 容 Web 是 不 存在 的 。 当 然 ，Pezl 是 一 种 优秀 的 书写 CGI 脚本 〈 上 由 














为 HIML 格式 在 


种 语言 ， 对 于 不 同 的 项 目 将 采用 最 合适 的 语言 。 大 多 数 情况 ， 你 要 选择 Perl 争 。 当 Larry 发 明 Perl 的 时 候 ， 


展 使 得 内 





























程序 ) 的 语言 ， 因 此 许多 人 如 今 仍 说 :“CGI 仅 是 Perl 吗 ? ”或 者 “为 什么 不 说 Perl 而 说 CGI? 风 





镶 不 要 较真 。 如 








果 想 知道 Per 是否 比 X 语言 好 , 那 同时 学 习 它 们 ， 看 那 种 语言 用 的 最 多 。 这 对 你 是 最 好 的 方法 。 








的 程序 ，Perl 也 能 很 好 的 胜任 。 当 然 ， 


程 任务 。 在 理想 情况 下 ， 每 一 个 程序 员 


Tim 
容 能 快速 转换 
web 服务 器 运行 的 








这 些 论述 很 有 意思 。 


















































你 将 更 好 的 到 





! 解 
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已 们 。 花 这 些 时 间 是 值得 的 。 
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， 同 时 学 习 两 种 语言 ， 
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1. 2. 7 Perl 不 擅长 什么 ? 








Perl 擅长 许多 事 ， 那 么 什么 是 它 不 擅长 的 呢 ? 不 应 当 使 用 Perl 来 产生 二 进 制 码 。 那 些 程序 可 以 给 别人 ， 或 卖 给 别人 ， 而 他 
们 不 能 看 到 程序 内 部 的 秘密 ， 同 时 也 不 能 维护 和 调试 代码 。 当 把 Perl 程序 给 别人 时 ， 通 常 给 他 们 的 是 源 代码 而 非 二 进 制 程 


























怠 








想 要 二 进 制 程序 时 ， 我 们 没 告 诉 你 不 可 能 。 如 果 人 们 能 安装 和 运行 你 的 程序 ， 它 们 也 能 反 编 译 出 来 ， 无 论 是 哪 种 语言 。 
然 , 这 可 能 和 你 最 初 的 源 代码 不 同 , 但 它们 在 某 种 程度 上 类 似 。 要 保护 你 的 程序 , 最 好 的 方法 是 , 找 些 律师 , 写 一 份 license: 
“你 可 以 利用 代码 做 这 个 ， 不 能 做 那个 。 如 果 违 反 这 个 规则 ， 那 我 们 将 有 律师 找 你 的 麻烦 ， 保 证 让 你 后 悔 ” 














I 几 卜 


















































1. 3 怎样 获得 Perl? 


你 可 能 已 丝 有 了 。 至 少 ， 我 们 去 的 地 方 都 装 有 它 。 它 被 移植 到 许多 系统 中 ， 系 统管 理 员 通常 把 它 安装 在 每 一 台 机 器 上 。 即 
便 如 此 ， 如 果 系 统 上 还 没有 安装 ， 你 也 可 以 免费 获得 。 












































Perl 通过 两 种 许可 证 〈license) 发 布 。 对 于 大 多 数 Perl 用 户 而 言 ， 任 意 许 可 证 都 足够 了 。 如 果 想 修改 Perl， 那 你 因 当 仔细 的 
阅读 这 些许 可 证 ， 这 里 面 有 对 修改 代码 的 一 些小 的 限制 。 对 于 不 修改 Perl 的 用 户 来 讲 ,“ 它 是 完全 免费 的 。?” 





















































因此 ， 它 是 免费 的 ， 可 以 在 任何 具有 C 编译 器 的 机 器 上 运行 。 下 载 它 ， 输 入 几 个 命令 ， 它 就 能 自动 配置 和 安装 。 其 至， 你 
可 以 让 系统 管理 员 帮 你 完成 这 些 事 争 。 除 了 _ Unix 和 类 Unix 系统 之 外 ， 人 们 特别 喜欢 将 它 移植 到 其 他 系统 中 ， 例 如 
Macintosh 争 ，VMS, 0S/2, MS/DOS, Windows， 当 你 阅读 本 书 时 ， 它 可 能 已 经 被 移植 到 更 多 的 系统 中 了 银 。 在 这 些 新 系统 中 
安装 Perl， 一 般 要 比 在 Unix 中 安装 容易 。 请 查看 “CPAN” 中 “移植 ”这 一 部 分 以 了 解 更 多 信息 。 




























































































急 如 果 系统 管理 员 不 能 安装 Perl， 那 雇 





寺 他 有 什么 用 呢 ? 如 果 你 说 服 他 们 有 困难 ， 去 买 份 pizza， 没 有 几 人 能 对 一 份 免 费 的 pizza 说 不 。 




















镶 Mac 操作 系统 中 使 用 的 是 MacPerl。 如 果 你 有 Mac 操作 系统 ， 它 是 类 Unix 系统 ， 那 么 你 拥有 主流 的 Perl。 


























急 现 在 还 不 适合 学 上 机 ， 因 为 它 太 大 了 。 曾 有 谣言 说 它 能 在 WinCE 上 运行 。 

















1. 3. 1 什么 CPAN? 





CPAN 是 全 面 Perl 归档 网 络 〈Comprehensive Perl Archive Network ) 的 缩写 ， 那 是 一 个 值得 常 去 的 地 方 。 这 里 有 Perl 源码 ， 
容易 安装 到 非 类 Unix 系统 的 Perl 争 ， 例 子 ， 文 要 ，Perl 扩展 部 分 ，Perl 归档 信息 等 。 简 言 之 ，CPAN 是 全 面 的 。 


































































































急 一 般 在 Unix 系统 中 ， 最 好 是 自己 编译 Perl。 在 别 的 没有 C 编译 器 或 其 它 工具 的 系统 中 ，CPAN 上 提高 了 二 进 制 的 Perl 。 




















CPAN 在 全 世界 有 上 百 个 镜像 站 点 。 在 http://serach. cpan. orfg/ 和 http://kobesearch. cpan. org 上 可 以 找到 他 们 。 如 
果 不 能 上 网 ， 你 可 以 从 CDROM 或 DVD-ROM 上 得 到 CPAN 中 的 部 分 内 容 。 去 附近 的 技术 书店 ， 找 一 份 最 近 的 CPAN 归 
档 光 盘 , 因为 CPAN 每 天 都 在 更 新 。2 年 以 前 的 文档 已 经 是 古董 了 。 最 好 找 一 个 能 上 网 的 朋友 , 让 它 帮 你 烧 录 份 最 新 的 CAN 
文档 。 
























































blei@ 163.com 1471201 9/21/2006 


1. 3. 2 怎样 获得 支持 ? 








你 有 所 有 的 源码 ， 所 以 得 自 





听 起 来 不 太 好 ， 是 吧 ? 但 是 好 事 
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允 复 错误 〈bugs 





[LD | 皆 
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下 。 | 
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四 版 ) 























于 没有 对 Perl 源码 的 限制 ， 任 何人 都 可 以 修改 源码 来 解决 bugs。 事 实 上 ， 当 你 发 现 






































并 确认 一 个 bug 时 ， 也 许 已 丝 有 人 解决 它 了 。 全 世界 有 几 千 人 在 维护 Perl。 

我 们 并 不 是 说 Perl 有 许多 bugs， 但 它 是 程序 ， 每 一 个 程序 都 全 少 有 一 个 bug。 为 了 说 明 为 什么 拥有 源码 会 如 此 有 用 ， 想 象 
你 有 劝 一 种 由 一 个 强大 组 织 ， 其 拥有 者 是 一 个 光头 的 亿 万 富 例 所 提供 的 名 为 Forehead 的 语言 ,〈 这 仅 是 一 个 假设 。 事 实 上 ， 
我 们 知道 没有 一 种 语言 叫做 Forehead)。 现 在 想 想 当 你 发 现 Forehead 中 有 bug 时 ， 你 能 做 什么 。 首 先 ， 你 报告 它 。 其 次 ， 

你 期 待 他 们 解决 它 ， 和 希望 他 们 尽快 解决 它 ， 并 且 下 一 版 要 价 不 要 太 高 。 在 下 一 版 中 ， 当 增加 新 功能 后 ， 不 要 引入 新 的 bugs， 
希望 那个 公司 不 会 违反 反 托 拉 斯 法 而 导致 破产 。 





对 于 Perl， 你 有 源码 。 如 果 不 幸 找 至 
理 ， 如 果 买 了 一 台新 机 器 ，Perl 不 能 


么 做 了 。 

















和 上 本 














1. 3. 3 有 其 它 的 支持 吗 ? 


AI 





你 附近 的 用 户 组 中 就 有 一 个 专家 ， 或 者 有 人 认识 某 个 专家 。 如 果 没 有 这 村 





当然 。 我 们 最 喜欢 的 是 Perl Mongers 。 这 是 | 




















运行 ， 你 可 以 自 


全 球 的 Perl 月 





己 


移植 它 。 


现在 ， 当 你 需要 











一 个 和 十 个 程序 员 来 解决 它 。 同 








上 的 bug 没 人 解决 ， 这 基本 上 是 不 可 能 的 ， 你 可 以 雇佣 






































户 组 组 成 的 。 在 http:Wwww.pm.org/ 可 以 找到 更 多 的 信息 。 可 





一 个 不 存在 的 功能 时 ， 你 知道 该 怎 











台 巴 
月 E 








的 组 ， 你 可 以 创建 一 个 。 


j 户 手册 外 人 争 ， 也 可 以 从 CPAN : http://www.cpan.org 上 找到 合适 的 





文 要 ， 当 然 还 有 其 它 站 点 ， 如 http:/perldoc.perlLorg， 上面 有 Perl 文档 的 HTML 和 PDF 版 本 ，http:/www.perldoc.org 可 以 让 
你 搜寻 不 同 版 本 的 文档 ，http:/Wfaq.perlLorg 上 有 最 新 版 本 perlfaq. 





令 用 


























另 一 份 权 威 的 资料 是 O'Reilly 出 版 的 Perl 编 和 


书 被 成 为 “小 骆驼 书 ”) 。 骆驼 书 
(CO'Reilly) 编写 的 Perl 5 的 袖珍 书 ， 你 可 以 随时 把 它 带 在 身边 〈 或 放 在 


如 果 想 问 问题 ， 网 上 有 大 量 的 新 闻 组 和 邮件 列表 人 镶 。 每 一 天 的 任意 时 刻 ， 都 有 某 个 时 
































在 Perl 帝 
人 热情 的 








急 许 多 邮 


国 里 太阳 永远 都 不 








帮助 你 。 



































扎 





语言 (Programming Perl) ， 


手册 s 是 类 UNIX 系统 上 的 一 种 文档 ， 如 果 没 有 Unix 系统 ，Perl 有 一 份 针对 你 的 文件 系统 的 文档 。 


、\ 记 


册 


























常 被 称 做 “骆驼 书 ” 因为 封面 上 有 骆驼 。( 本 











有 详尽 的 参考 信息 , 一 些 教程 , 和 大 量 的 关于 Perl 的 额外 信 ， 











， 你 问 一 个 问题 ， 


牛 列表 可 以 在 http:/Wlists.perlLorsg 中 得 到 。 









































息 .还 有 一 本 由 Johan Vromans 
袋 里 )。 
区 的 Perl 专家 在 新 闻 组 中 回答 问题 ; 











通常 数 几 分 钟 内 就 有 答案 。 如 果 不 先 查 看 FAQ， 很 快 就 有 











官方 的 Perl 新 闻 组 在 comp.lan.perl.* 的 某 些 层级 上 当 写作 本 书 时 ， 有 五 个 ， 当 它们 经 第 改变 。 你 《或 者 某 个 别 的 负责 你 们 














忆 
使 





t 直 





屠 





blei@163.com 





里 Perl 的 人 ) 应 当 订 阅 comp. lang. perl. anounce, 上 面 有 Per1l 的 
用 新 闻 组 的 帮助 ， 请 教 附 近 的 专家 。 














13 /201 


重 查 




















惠 妇 


通知 ， 特 别 是 关 了 




















安全 方面 的 通知 。 如 果 需 要 如 何 
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有 几 个 著名 的 讨论 Perl 的 Web 站 点 。 
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者 和 专栏 作家 ， 至 少 包 括 本 书 的 两 位 作者 。 你 可 以 查看 http:Wlearn.perlorg/ 和 和 它 相 关 的 邮件 列表 beginners@perlorg. 











其 中 最 若 名 的 是 :Perl Monastery Chttp:/www.perlmonks.org), 其 


























中 有 许多 Perl 书籍 的 作 














如 果 需 要 付费 的 帮助 ， 有 一 些 公司 乐意 为 你 提供 任意 数量 的 收费 服务 的 帮助 。 当 然 也 有 许多 免费 的 服务 。 


| 





1. 3. 4 当 发 现 Perl 中 有 错误 时 ， 该 怎么 办 ? 














当 发 现 bug 时 ， 第 一 件 事 是 再 次 争 检 查 文档 争 。Perl 有 许多 特殊 性 























E 质 ， 和 不 符 规 则 的 地 方 ， 你 应 当 

















殊 性 质 还 是 bug。 检 查 你 的 Perl 是 否 是 老 版 本 ， 也 许 你 发 现 的 问题 在 新 一 些 的 版 本 中 已 经 得 到 了 解决 。 











全 甚至 Larry 也 承认 ， 他 经 常 参考 这 些 文档 。 


























角 认 你 发 现 的 是 某 个 特 


镶 甚 至 两 次 或 三 次 。 大 多 数 时 候 ， 当 我 们 查看 文档 以 得 到 找到 某 一 异常 行为 的 解释 是 ， 通 常 得 到 某 些 别 的 细微 差别 的 介绍 。 











的 仍 是 一 个 特殊 性 质 而 非 bug。 












































任何 Perl 用 户 都 能 执行 它 ， 并 且 能 得 到 和 你 
中 带 有 它 ) 这 个 工具 来 报告 它 。 它 会 把 这 个 问题 用 邮件 发 给 Perl 的 天 



































| 由 








把 bug 报告 出 去 后 ， 你 的 














ZI 





三 





1. 4 怎样 才能 写 一 个 Pe 








rl 程序 ? 














当 几 乎 认定 发 现 的 是 一 个 真正 的 bug 时 ， 问 问 你 周围 的 人 。 问 问 那些 工作 的 ， 或 者 附近 的 Perl 协会 中 的 人 。 通 常 ， 你 发 现 











当 你 肯定 发 现 的 是 pug， 那 么 准备 一 个 测试 案例 (test case)。 (你 以 前 没有 做 过 吗 ? ) 理想 的 测试 案例 是 ， 一 段 小 的 的 程序 ， 
致 的 结果 。 准 备 好 一 个 能 反映 这 个 bug 的 测试 案例 后 ， 应 当 用 











perlbug 〈Perl 














F 发 者 , 因此 在 准备 好 测试 案例 之 前 不 要 随 

















便 使 用 perlbug。 


情 就 完成 了 ， 通 第 能 在 几 分 钟 内 得 到 回应 。 一 般 ， 你 会 得 到 一 块 小 的 补丁 ， 然 后 你 的 Perl 就 
E 恢 复 正 常 。 当 然 ， 你 也 可 能 得 不 到 任何 回答 ， 因 为 Perl 的 开发 者 没有 义务 来 阅读 这 些 bug 报告 。 但 我 们 都 热爱 Perl， 我 
门 不 希望 Perl 中 有 任何 错误 从 我 们 的 眼皮 底下 溜 走 。 





是 时 候 问 这 个 问题 了 《也 许 你 还 没有 呢 )。Perl 程序 是 文本 类 型 的 ， 可 以 用 你 最 喜欢 的 文本 编辑 器 来 创建 它们 〈 你 并 不 需要 








任何 特别 的 开发 环境 ， 昌 然 有 一 些 商 业 公司 提供 。 我 们 对 于 这 些 工 具 都 使 有 




















应 当 使 用 程序 员 的 文本 编辑 器 (programmer's text editon)， 
例如 缩 进 ， 或 非 缩 进 一 块 代码 ， 能 匹配 对 应 的 花 括 号 等 。 媳 














辑 器 能 提供 一 个 程序 员 所 需要 的 功能 ， 


































































































旧 不 多 ， 所 以 不 够 资格 推荐 它们 。) 


而 不 是 普通 的 编辑 器 。 它们 有 什么 不 同 点 呢 ? 一 般 ， 程序 员 的 编 
E Unix 系统 中 两 个 最 流行 


的 程序 员 编辑 器 是 emacs 和 vi〈 以 及 它们 的 克隆 和 变种 )。BBEdit 和 Alpha 是 Mac 系统 中 两 个 优秀 的 编辑 器 。 在 Windows 
平台 上 ， 口 碑 很 好 的 编辑 器 是 UltraEdit 和 PFE( 程 序 员 喜欢 的 编辑 器 (Programmer's Favorite Editor))。Perlfaq2 上 列 有 几 个 
其 它 的 编辑 器 。 询 问 你 当地 的 专家 ， 让 他 推荐 你 机 器 上 的 编辑 器 。 
























































对 于 本 书 的 练习 题 而 言 ， 其 代码 长 度 都 在 20 或 30 行 之 内 ， 任 意 编辑 器 都 能 胜任 。 

















少数 的 初学 者 使 用 字 处 理 软件 而 非 文 本 编辑 器 。 我 们 不 同意 这 样 做 ， 
























































因为 它们 不 仅 不 方便 ， 同 时 很 可 能 带 来 错误 。 但 我 们 











有 它 自 己 的 格式 ， 这 些 东西 通常 





不 阻止 你 。 当 你 这 样 做 ， 在 保存 时 ， 请 把 文件 保存 为 仅 文本 类 型 的 (text only)， 字 处 理 软 作 




















是 无 用 的 。 许 多 字 处 理 软件 很 可 能 提 本 
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星 你 Perl 程序 拼写 错误 ， 应 当 使 月 
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昌 更 少 的 分 号 等 等 。 
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某 些 情况 下 ， 你 可 能 在 一 台 机 器 上 书写 程序 ， 然 后 在 另 一 台 机 器 上 运行 。 如 果 需 要 这 样 做 ， 确 定 传输 文件 时 选 的 是 “文本 ” 
(text) 模式 或 “ASCIT 模式 而 非 “ 二 进 制 ”(binary) 模式 。 选 择 这 种 方法 的 原因 是 ， 不 同 机 器 有 不 同 的 文本 格式 。 如 果 不 
这 样 做 ， 可 能 得 到 不 一 致 的 结果 。 某 些 版 本 的 Perl， 当 检测 到 行 结束 符 不 对 时 ， 会 中 断 执行 。 






































1. 4. 1 一 个 简单 的 例子 











依据 传统 ， 关 于 计算 机 语言 的 书籍 ， 应 当 以 “Hello,world”" 这 个 程序 开始 。 下 面 是 其 Perl 版 本 : 


训 














#! /usrbin/perl 


print “Hello,wordl\n” ; 





我 们 假设 你 已 经 把 它 输入 到 文本 编辑 器 中 。( 别 担心 这 个 程序 的 含义 以 及 它 如 何 执行 。 你 将 很 快 知 道 )。 可 以 将 它 以 你 喜欢 
的 任何 名 字 命 名 。Perl 不 需要 任何 特别 的 文件 名 字 或 后 缀 名 ， 但 最 好 不 要 使 用 后 缀 名 争 。 有 些 系统 中 需要 像 .px (PerL 
eXecutable, 可 执行 的 Perl) 这 样 的 后 绥 : 可 以 查看 系统 上 的 release notes 来 获得 这 些 信 息 。 


















































镶 为 什么 最 好 不 要 后 绥 呢 ? 想象 写 了 个 给 保龄球 记分 的 程序 ， 你 告诉 所 有 的 饿 朋友 它 被 称 为 bowling.plx。 某 一 天 ， 你 决定 用 C 重新 写 它 。 
你 应 该 仍 以 相同 的 名 字 命 名 ， 表 示 它 仍 用 Perl 写成 ? 还 是 告诉 他 们 ， 它 有 了 个 新 名 字 ? 《〈 噢 ， 请 不 要 把 它 叫 做 bowling.c)。 事 实 上 ， 他 
们 不 关心 你 用 什么 语言 号 它 ， 他 们 只 管用 。 因 此 ， 如 果 当 初 把 它 命 名 为 bowling， 你 将 少许 多 麻烦 事 。 










































































也 许 需要 做 些 事情 ， 让 你 的 系统 知道 它 是 可 执行 程序 。 需 要 做 什么 呢 ， 视 你 的 系统 而 定 。 也 许 你 只 需 把 它 放 在 某 个 特定 的 
路 径 就 行 了 。( 通 常 你 的 当前 目录 就 行 了 )。 在 Unix 系统 中 ， 你 需要 用 chmod 命令 将 程序 变 成 可 执行 的 ， 可 能 像 下 面 : 

































































$ chmod a+x my_program 























行 首 的 美圆 符号 〈《$)《〈 和 空格 ) 是 shell 提示 符 ， 可 能 你 的 系统 上 有 些 不 同 。 也 可 在 chmod 后 使 用 755 来 代替 a+x 。 两 种 
方法 都 是 告诉 系统 这 个 文件 是 一 个 程序 〈 可 执行 的 )。 











现在 你 可 以 如 下 运行 它 : 


$ ./my_program 



































令 开 始 的 点 和 和 斜 线 表 示 在 当前 路 径 查 找 程序 。 事 实 上 并 非 在 所 有 情况 下 都 需要 ， 在 完全 理解 它 之 前 ， 你 应 当 每 次 都 使 用 
争 。 如 果 运 行 顺利 ， 这 看 起 来 像 奇迹 。 通 常 ， 你 会 发 现 程序 有 错误 。 编 辑 ， 再 试 一 次 ， 当 然 不 需要 每 次 都 使 用 chmod 命 
， 因 为 这 个 文件 的 权限 已 经 被 修改 过 了 。 当然， 如果 没有 正确 的 使 用 chomd 命令 ， 你 可 能 在 shell 中 得 到 不 允许 操作 
“permission denied” 这 样 的 信息 )。 






































心 以 登 






































镶 简 言 之 ， 它 防止 你 运行 另 一 个 相同 名 字 的 程序 (shell 内 肉 的 )。 新 手 的 一 个 普遍 错误 是 把 它 命名 为 test， 而 许多 系统 都 有 这 样 的 程序 (shell 
内 嵌 的 )。 这 就 是 新 手 运行 的 为 什么 不 是 他 们 自己 程序 的 原因 。 
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1. 4. 2 这 个 程序 有 些 什么 ? 








同 任意 自由 格式 语言 一 样 ，Perl 通常 允许 使 用 任意 数量 的 空白 (如 空格 ， 制 表 符 ， 换 行 符 ) 来 使 程序 易于 阅读 。 但 大 多 数 Penl 
程序 使 用 一 种 标准 格式 ， 非 常 像 刚 才 展 示 的 程序 。 我 们 强烈 的 鼓励 你 使 用 缩 进 格式 的 程序 ， 使 你 的 程序 更 易 阅 读 ， 一 个 好 
的 文本 编辑 器 能 代 你 完成 许多 事情 。 好 的 注释 能 让 程序 易于 理解 。 在 Perl 中 , 注释 由 # 开 始 ， 直 到 本 行 结 束 (Perl 中 没有 “ 块 
注释 ”(block comments )) 争 。 在 本 书 的 程序 中 我 们 没有 使 用 大 量 的 注释 ， 因 为 正文 中 已 经 解释 了 它们 ， 而 你 自己 的 程序 ， 
应 当 使 用 注释 。 


































































































合 但 是 有 许多 伪造 的 方法 。 查 看 FAQ( 在 许多 情况 下 ， 可 以 用 perldoc perlfad 来 查看 ) 


因此 ， 另 一 种 〈 看 起 来 ， 有 些 奇怪 ) 写 “"Hello,world” 的 方法 是 : 





#! /usrYbin/perl 
print # 这 是 注释 
“Hello，worldIvm” 
# 不 要 这 样 写 代码 











第 一 行 是 特殊 的 注释 。 在 Unix 系统 中 人 争 ， 如 果 文 本 的 第 一 行 前 两 个 字符 是 津 记 ， 接 关 的 就 是 执行 下 面 文件 的 程序 。 在 本 例 
中 ， 这 个 程序 是 ppsVBDipperl。 
































#! 行 和 程序 的 可 移植 性 相关 ， 需 要 找到 每 台 机 器 的 存放 地 点 。 可 和 运 的 是 ,通常 都 被 放 在 mszBpipperl 或 ms7ocaVpiperl 中 。 
如 果 不 是 这 样 ， 则 需要 找到 你 自己 机 器 上 perl 的 存放 地 点 ， 然 后 使 用 那个 路 径 。 在 Unix 系统 中 ， 可 能 使 用 如 下 一 行 找到 
perl: 
































#! /usrbin/env perl 











如 果 Perl 存放 的 路 径 不 在 你 的 搜索 路 径 上 ， 应 当 询 问 你 的 系统 管理 员 或 者 某 一 个 和 你 使 用 同一 台 机 器 的 人 。 














在 非 Unix 系统 中 ， 传 统 上 把 第 一 行 写 做 #!perl。 至 少 ， 它 立刻 告诉 程序 的 维护 者 ， 这 是 一 个 Perl 程序 。 如 果林 行 错 了 ， 通 
常会 在 shell 中 得 到 一 些 错 误 信 息 。 通 常 是 一 些 意 想 不 到 的 信息 ， 如 文件 不 存在 “fle not found”。 这 不 是 说 没有 找到 你 的 文 
件 ; 而 是 说 perl 没有 在 [spizpe7z 那里 (其 恰当 的 地 方 )。 我 们 应 当时 这 条 背 息 更 清晰 ， 但 它 不 是 Perl 而 是 shell 给 的 。( 顺 
便 提 醒 下 ， 不 要 把 wsr 写成 wxer， 因 为 发 明 Unix 的 伙计 懒 于 书写 ， 因 此 省 略 了 许多 字符 )。 



















































































另 一 个 问题 是 ， 你 的 系统 可 能 根本 不 支持 #!。 如 果 这 样 ， 你 的 shell (或 者 别 的 )， 可 能 要 自己 执行 你 程序 ， 得 到 一 些 让 人 吃 
惊 的 结果 。 如 果 不 知道 这 些 错误 信息 ， 你 可 以 查看 perldiasg 的 用 户 手册 。 











“main" 程 序 包 含 了 所 有 Pezl 语句 〈 不 包括 子 程序 ， 你 在 后 面 会 看 到 )。 和 C 或 Java 不 一 样 ，Perl 中 没有 “main” 程 序 。 









































和 其 它 语 言 不 同 ，Perl 中 不 需要 声明 变量 。 如 果 其 它 语言 中 你 必须 申明 变量 ， 这 可 能 让 你 惊奇 。 但 它 让 我 们 快速 号 出 Pedl 
程序 。 如 果 程 序 只 有 两 行 ， 不 希望 其 中 一 行 仅仅 是 申明 变量 。 如 果 你 想 声 明 变 量 ， 这 是 好 事 ， 第 四 章 有 详细 说 明 。 


















































许多 语句 ， 由 表达 式 后 接 分 号 组 成 。 下 面 是 你 已 经 看 了 几 次 的 语句 : 
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print “Hello,worldl\n ; 



































你 可 能 狂想， 这 行将 打印 出 Hello,world!。 结 尾 是 m， 如 果 使 用 过 C，C++，Java， 你 可 能 知道 它 是 换行 。 当 打印 出 这 条 信 
县 后 ， 换 行 ，shell 提示 符 出 现在 新 行 上 ， 而 不 是 在 上 一 条 信息 之 后 。 单 行 的 输出 应 当 以 换行 符 结束 。 下 一 章 我 们 将 学 习 更 
多 的 关于 换行 符 ， 和 其 它 由 反 和 斜 线 〈\) 转 义 的 符号 。 












































1. 4. 3 怎样 编译 Perl? 

















只 需要 运行 你 的 Perl 程序 。Perl 的 解释 器 将 编译 和 运行 你 的 程序 。 











$perl my_grogram 


当 运行 程序 时 ，Peal 的 内 部 编译 器 首先 遍历 整个 源 程序 ， 把 它 转变 为 内 部 的 字 节 码 ， 它 是 程序 的 一 种 内 部 数据 结构 。Ped 
的 字 节 码 引 擎 将 运行 这 些 字 节 码 。 如 果 200 行 有 一 个 语法 错误 ， 在 执行 程序 的 第 二 行 争 ， 你 将 得 到 出 错 信息 。 如 果菜 个 循 
环 运 行 5000 次 ， 它 将 一 次 编译 ;循环 将 以 最 快 的 速度 运行 。 程 序 的 注释 不 会 增加 程序 的 运行 开支 。 如 果 某 个 表达 式 的 计算 
结果 是 一 个 常数 ， 那 在 程序 开始 运行 时 ， 就 会 以 这 个 常数 来 奉 换 ， 而 不 需 每 次 循环 重新 计算 。 










































































一 个 可 能 的 例外 情形 是 ， 当 写 了 一 个 CGI 脚本 ， 它 可 能 每 分 钟 被 调用 成 百 上 千 次 。( 这 个 使 用 率 很 高 。 如 果 一 天 被 调用 百 
次 ， 王 次 ， 我 们 并 不 担心 )。 许 多 此 类 程序 都 具有 很 短 的 运行 时 间 ， 因 此 重新 调 入 他 们 将 是 笔 可 观 的 开支 。 如 果 这 对 你 是 个 
严重 的 问题 ， 你 希望 找 一 种 方法 能 让 你 的 程序 保持 在 内 存 之 中 。 有 一 个 关于 Apache web server (http:/perlLapache.ors ) 的 模 
块 :CGI:Fast 兴 许 能 帮助 你 。 



























































可 以 保存 这 些 编译 过 后 的 字 节 码 以 减轻 编译 的 负担 吗 ? 或 者 ， 更 好 的 是 ， 可 以 把 这 些 字 节 码 转换 为 别 的 语言 ， 如 C， 然 后 
编译 他 们 ? 这 两 件 事 ， 在 某 种 程度 上 都 是 可 行 的 ， 但 它们 可 能 使 程序 难于 使 用 ， 维 护 ， 调 试 和 安装 ， 也 可 能 让 你 的 程序 运 
行 更 慢 。Peal 6 在 这 方面 有 重大 改进 ， 但 现在 讨论 还 为 时 过 早 〈 当 我 们 写 做 此 书 时 )。 


1. 5S$ 快速 了 解 Perl 


想 看 一 个 有 些 意思 的 Perl 程序 吗 〈 如 果 不 想 ， 那 随便 看 看 ) ? 如 下 就 是 一 个 : 
#! /usrbin/perl 













































































@lines= perldoc -u -ft atan2 ; 
foreach(@lines){ 
SAwW<([^>]+) 人 AU$1/sg; 
Print; 


} 








当 第 一 次 看 见 这 样 的 Perl 代码 时 ， 你 可 能 觉得 很 奇怪 。( 事 实 上 ， 每 次 你 看 到 这 样 的 Perl 代码 时 ， 都 觉得 它们 奇怪 )。 让 我 
们 一 行 一 行 的 来 学 习 它 ,看 看 这 个 例子 完成 了 什么 样 的 任务 。( 这 些 解释 很 简洁 ; 这 里 只 是 大 致 的 讲解 。 在 本 书 的 剩 下 章节 ， 
我 们 将 更 加 详细 的 讨论 它们 。 现 在 并 不 假定 你 完全 理解 它 ， 那 是 以 后 的 事情 。) 








了 计 









































第 一 行 是 毁 这 一 行 ， 我 们 已 经 见 过 了 。 你 也 许 要 修改 它 ， 我 们 已 经 讨论 过 了 。 


























第 二 行 运行 了 一 个 外 部 命令 ， 由 `` 括 起 来 了 。( 反 引号 “ 通常 在 美式 键盘 数字 1 的 左边 。 不 要 和 单 引号 “ 混淆 了 。) 我 们 用 
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的 命令 的 是 perldoc -u -fatan2; 在 命令 行 输入 这 个 命令 ， 看 看 能 得 到 什么 结果 。perldoc 这 个 命令 能 在 大 多 数 机 器 中 使 用 ， 
它 显示 相关 的 文档 急 。 这 个 命令 告诉 你 一 些 关 于 反正 切 男 数 atan2 的 信息 ; 在 这 里 我 们 把 它 做 为 一 个 外 部 命令 ， 并 处 理 它 
的 输出 信息 。 




















急 如 果 perldoc 不 能 使 用 。 那 可 能 是 因为 你 的 系统 没有 命令 行 接口 ， 你 的 Perl 不 能 通过 反 引 号 或 piped-open 〈 请 查看 chapter14 ) 来 运行 命 
令 〈 如 perldoc)。 如 果 是 这 样 的 ， 应 当 跳 过 需要 利用 perldoc 的 练习 。 












































反 引 号 内 的 命令 的 输出 被 保存 在 @lines 中 。 下 一 行 是 一 个 循环 ， 它 依 行 处 理 @lines 中 的 信息 。 循 环 内 语句 是 缩 进 的 。 里 然 
Perl 并 不 需要 这 样 ， 当 这 是 好 的 编程 习惯 。 











循环 内 的 第 一 行 让 人 惊慌 ; 它 是 SNAw<([^>]+)>AU$l\g;， 这 里 不 过 多 的 讨论 细节 ， 我 们 只 提示 下 ， 它 能 改变 有 特殊 标记 《〈<>) 
的 行 ,在 每 一 perldoc 这 个 命令 的 输出 中 ， 都 至 少 有 一 行 具有 这 样 的 形式 。 




















下 一 行 ， 令 人 恢 奇 的 是 ， 它 输出 每 一 行 〈 可 能 是 修改 过 的 )。 输 出 的 结果 和 perldoc u -fatan2 类 似 ， 但 标记 《〈<>) 内 的 内 
容 有 些 不 同 。 

















总 结 下 ， 通 过 这 几 行 程序 ， 我 们 运行 了 另 一 个 程序 ， 把 它 的 输出 保存 在 内 存 中 ， 修 改 内 存 中 的 数据 ， 再 把 结果 输出 来 。 这 
种 把 数据 从 一 种 形式 转换 成 只 一 种 形式 的 程序 在 Perl 中 很 常见 。 




















1. 6 第 六 节 练习 
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一 、 




















常 ， 每 一 章 都 会 由 一 些 练习 来 结束 ， 答 案 在 附录 A 中 。 但 是 不 需要 完成 这 些 练 习 来 结束 本 章 的 学 习 ， 它 们 只 是 正文 的 补 


卉 各 





如 果 不 能 在 机 器 上 练习 这 些 习题 ， 询 问 你 附近 的 专家 。 记 住 应 当 仔细 的 推 殴 这 些 习题 。 
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表示 第 一 章 





还 
尽 
忆 
地 
恒 
大 
当 
医 
[CS 





[7 了] 输入 “Hello,world” 这 个 程序 ， 让 它 运 行 起 来 。( 你 可 以 任意 命名 ， 但 像 exl_1 这 样 贡 
第 一 个 练习 。) 








2 [5 在 命令 行 输入 perldoc -u-f atan2 这 个 命令 ， 注 意 它 的 输出 。 如 果 命 令 无 效 ， 询 问 你 的 管理 员 或 者 从 文档 〈 这 个 版 
本 的 Penl 文档 ) 中 查看 调用 perldoc 或 其 等 价 的 方法 。( 你 需要 做 这 些 来 完成 下 一 个 练习 ) 
























































3 [6] 运 行 第 二 个 例子 〈 前 一 节 中 )， 观 察 它 的 输出 。( 提 示 : 注意 正确 输入 这 些 标点 符号 )。 注 意 到 和 第 二 题 输 出 的 不 同 
地 方 了 吗 ”? 
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在 英语 以 及 许多 其 它 的 语言 中 ， 需 要 区 别 单数 和 复数 。 作 为 一 门 由 语言 学 家 发 明 的 语言 ，Perl 也 是 类 似 的 。 同 一 般 情 况 一 
样 ，Perl 也 有 数据 类 型 一 标量 争 。 标 量 是 Perl 中 最 简单 的 数据 类 型 。 大 多 数 的 标量 是 数字 〈 如 255 或 3.2$e20) 或 者 字符 呈 
(如 hello 争 或 者 盖 葡 堡 地 址 )。 你 也 许 把 数字 和 字符 串 看 作 不 同 的 事物 ， 但 Perl 几乎 以 相同 的 观点 来 看 符 它 们 。 
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急 这 个 概念 和 数学 或 者 物理 学 中 的 标量 〈 一 个 单独 的 是 事物 ) 没有 多 少 关 系 ， Perl 中 也 没有 向 量 。 
急 如 果 使 用 过 别 的 编程 语言 ， 你 可 能 把 hello 看 作 5 个 字符 的 组 合 ， 而 不 是 一 个 单独 的 东西 。 但 在 Perl 中 ， 一 个 字符 串 是 一 个 标量 数据 。 
当然 ， 可 以 使 用 这 个 字符 串 内 部 的 值 ， 你 将 在 后 面 章 节 中 了 解 到 怎么 做 。 
标量 数据 可 有 操作 符 《〈 如 相 加 和 串联 ),， 通常 会 产生 一 个 新 的 标量 数据 。 标 量 数据 的 值 可 以 存放 在 标量 变量 中 。 标 量 可 以 从 











文件 或 设备 读 取 ， 也 可 以 写 进去 。 


2. 1 数字 

















昌 然 标量 在 大 多 数 情 况 下 不 是 数字 就 是 字符 串 ， 现 在 我 们 最 好 还 是 将 它们 分 开 来 看 待 。 我 们 首先 讨论 数字 ， 再 讨论 字符 串 。 














2. 1. 1 所 有 数字 内 部 的 格式 一 致 





在 下 面 几 段 中 ， 你 将 看 到 整数 (如 2355，2001 等 ) 和 浮 点 数 (有 小 数 点 的 实数 ， 如 3.14159，1.35x102 )， 但 在 内 部 ，Peal 都 把 
它们 当 作 双 精 度 浮 点 数 来 处 理 争 。 这 就 是 说 在 Perl 内 部 没有 整数 值 。 程 序 中 的 整数 被 当做 等 价 的 浮 点 数 来 处 理 争 。 你 也 许 
注意 不 到 这 种 转换 〈 或 者 不 关心 )， 但 你 不 应 当 寻 找 只 属于 整数 的 操作 符 〈 不 能 被 浮 点 数 使 用 的 )， 因 为 它们 不 存在 急 。 



































































































































镶 双 精度 浮 点 类 型 类 似 于 C 中 由 double 定义 的 类 型 。 它 们 的 大 小 可 能 和 具体 的 机 器 相关 , 许多 当代 的 系统 都 使 用 IEEE-754 的 格式 , 它 有 15 
位 精度 ， 其 范围 至 少 在 le-100 到 le100 之 间 。 



































争 有 时 ，Perl 也 会 使 | 


急 Perl 中 有 intesger pragma. 但 如 何 使 











j 内 部 的 整数 ， 














其 对 程序 员 不 可 见 。 这 样 做 导致 的 唯一 不 同 是 ， 程 序 将 运行 更 快 。 





问题 。 
2. 1. 2 浮 点 数 


数字 符号 〈literal) 是 Perl 程序 源 代 码 


数据 。 
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21/1201 


谁 又 能 抱怨 它 呢 ? 


j 它 超出 了 本 书 的 范围 。 正 如 你 将 看 到 的 ， 某 些 操 作 可 以 从 浮 点 数 得 到 整数 。 但 那 不 是 我 们 此 刻 讨论 的 


代替 某 个 值 的 方法 。 数 字符 号 不 是 计算 或 IO 操作 的 结果 ， 它 是 直接 写 进 代 码 中 的 
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你 可 能 已 经 很 熟悉 Perl 的 浮 点 数 。 有 或 没有 小 数 点 的 数字 都 是 允许 的 (包括 + 或 -号 ), 也 可 佛 一 个 十 进 制 的 指数 (符号 为 也 )。 


1.25 
255.000 

255.0 

7.2$e45 ” 帮 .25Sx10 的 45 次 方 (一 个 大 整数 ) 
-6.Se24 #-6.Sx10 的 24 次 方 〈 一 个 大 的 负数 ) 
-12e-24 # -12xl10 的 -24 次 方 〈 很 小 的 负数 ) 
-1.2E-23 ”机 骨 数 符 号 可 以 大 写 (B) 


2. 1. 3 整数 


整数 是 简单 明了 的 ; 


0 

2001 

-40 

255 
01298040283708 











最 后 一 个 读 起 来 有 些 困 难 。Perl 允许 用 下 划 线 来 分 陋 它 ， 因 此 可 以 像 下 面 这 样 书写 : 











01_298_040_283_768 








但 形式 上 有 些 不 同 。 你 可 能 认为 有 逗号 () 更 恰当 ， 但 喜 号 在 Perl 中 有 其 它 用 途 《〈 下 一 章 中 将 介绍 )。 











它们 是 相同 的 值 
































2. 1. 4 非 十 进 制 整 数 














同 许多 其 它 语 言 一 样 ，Perl 也 允许 使 用 非 10 为 底 的 数字 。 八 进 制 以 0 开头 ， 十 六 进 制 以 0x 开头 ， 二 进 制 0b 开头 争 。 在 十 
六 进 制 中 A 到 下 (或 者 a 到 f 分 别 表 示 10 到 15: 























0” 指 示 符 只 对 数字 有 效 ， 对 由 字符 串 转 换 过 来 得 数字 无 效 ， 在 本 章 后 面 你 可 以 看 到 。 可 以 利用 oct0 或 hexO 把 某 个 看 起 来 像 八 
的 数据 串 转 换 成 数字 。 昌 然 没 有 “二 进 制 ”(bin) 函数 来 转换 二 进 制 的 值 ， 如 果 某 个 字符 串 以 0b 开头 可 由 octO 做 到 。 





他 66 前 
进 制 或 十 六 进 制 
















































































0377 # 八 进 制 数字 377， 等 同 于 十 进 制 数 字 255 
0Ox 任 # 十 六 进 制 数字 FE， 等同 于 十 进 制 数字 255 
0bll111111  # 千 同 于 十 进 制 数字 255 



































这 些 数 字 表 面 上 看 起 来 并 不 相同 ， 但 这 三 个 数 在 Perl 中 都 代表 同一 个 数 。 对 于 Penl 来 讲 ，0 xFF 或 255.00 是 没有 区 别 的 ， 
因此 选择 一 种 你 和 你 的 程序 维护 者 〈 我 们 是 指 那个 要 读 懂 你 代码 的 可 怜 伙 计 。 通 常 ， 这 个 可 怜 的 家 伙 就 是 你 ， 你 很 可 能 想 
不 起 3 个 月 前 ， 你 为 什么 要 那样 做 ) 认为 最 有 意义 的 一 种 。 
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由 























一 个 非 十 进 制 的 数字 超过 4 位 时 ， 读 起 来 将 很 








困难 。! 





0x1377_0B77 
0x50.69 /127C 


2. 1. 5 数字 操作 符 











Perl 除了 提供 通常 的 操作 符 加 (+)， 减 (-)， 乘 (*)， 除 9) 等 等 之 外 : 











2+3 #2+3，$ 

5124 条 .1254 27 

3*#12 #3*#12，36 

14/2 扯 到 2 

10.2/0.3 。 #10.2/0.3，34 

10/3 起 重 常 是 浮 点 除 ，3.33333..…… 


于 这 个 理由 ，Perl 允许 你 使 用 下 划 线 来 区 分 : 











还 提供 了 模 数 运算 符 〈 多 )。10%3 的 值 是 10 除 以 3 的 余数 。 两 个 操作 数 首先 变 成 它们 对 应 的 整数 值 ， 如 10.5%3.2 转换 为 








10%3 争 后 再 计算 。 另 外 ，Pezl 中 提供 








了 和 FORTRAN 类 似 的 指数 操作 符 ，C 和 Pascal 很 希望 有 类 似 的 能 力 。 这 个 操作 符 由 


两 个 * 号 表示 ， 如 2**3， 表 示 2 的 3 次 方 ， 等 于 8 急 。 我 们 将 在 需要 的 地 方 介 绍 其 它 的 数字 操作 浮 。 











急 注 意 ， 在 模 数 运算 中 ， 如 果 有 一 个 操作 数 为 负数 ， 那 民 











结果 和 Perl 的 具体 实现 相关 。 








镶 通 常 不 能 进行 一 个 负数 的 非 整数 次 方 的 运算 。 对 数学 有 
如 果 想 进行 类 似 的 预算 ， 你 需要 Math: : Complex 这 个 模块 





























2， 2 字符 串 


2 AR 


字符 串 是 一 串 字符 (如 hello)。 字 


什 昌 可 能 十 
整个 内 存 。 这 符合 Perl 的 哲学 ， 只 要 有 可 能 就 不 加 任何 内 骨 的 限制 。 


Ar 呈 『 台 已 上 四 








、\ 记 














日 








一 定 了 解 的 读者 知道 ， 这 将 产生 一 个 复数 《数学 概念 中 的 复数 : 如 1+2i， 译 注 )。 





字符 的 任意 组 合 银 。 最 短 的 字符 串 不 含 任何 字符 。 最 长 的 字 
常 字符 串 是 可 打印 





划 





ASCII 32 到 ASCIIE 126)。 但 ，Perl 中 字符 串 可 以 包含 任意 字符 ， 



































意味 着 利用 字符 串 (string) 你 可 以 创建 ， 饥 历 ， 操 作 二 进 







































































符 串 ， 可 以 填 满 
数字 ， 标 点 符号 的 序列 (从 


制 


2 


子 们 ， 
































数据 ,而 利用 别 的 方法 可 能 遇 到 极 大 的 困难 。 例 如 ， 你 可 以 把 要 更 新 的 图 片 或 编译 好 的 程序 放 入 一 个 Perl 的 字符 串 变 量 中 ， 
做 完 相 应 的 修改 后 ， 再 写 回 去 。 

争 和 C，C++ 不 同 ，Perl 中 NUL 字符 没有 特殊 的 含义 。Perl 能 计算 长 度 ， 不 用 靠 null 来 判断 字符 串 是 否 结束 。 
和 数字 一 样 ， 字 符 串 也 可 由 文字 符号 diteral) 来 表示 ， 它 用 来 在 Perl 程序 中 代表 某 个 字符 串 。 有 两 种 类 型 的 字符 串 : 单 引 号 
字符 串 和 双 引 号 字符 串 。 
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2. 2. 1 单 引 号 字符 串 











定量 一 2 殉 = 


单 引 号 字符 串 是 由 单 引 号 括 起 来 的 字符 月 
除了 单 引号 ， 或 者 反 和 斜 线 (包括 换行 字符 ， 


















































列 。 单 引号 不 是 字符 串 的 一 部 分 








,但 Perl 可 以 利用 它 来 辨别 字符 串 的 开始 和 结束 。 
如 果 字 符 串 在 下 一 行 继续 ) 之 外 的 任何 字符 都 表示 它 自身 。 要 





得 到 一 个 反 斜 线 ， 





可 以 把 两 个 反 斜 线 放 在 一 起 ;要 得 到 单 引 号 ， 需 要 在 单 引号 前 加 上 反 斜 线 : 








fred” # 四 个 字符 ; 
“barmey' # 六 个 字符 
”。 # 空 字符 〈 没 有 字符 ) 

"Don't let an apostrophe end this string prematruely! 


fre,d 





the last character of this string is a backslash: \\ 
hellom #nello 紧 跟 着 反 斜 线 和 nn 

hello 
there” 
人 





#hello, 换 行 ，there ( 共 11 个 字符 ) 
# 单 引号 () 跟 着 反 和 斜 线 () 





单 引 号 字符 串 中 的 \m 不 会 被 当 作 换 行 符 来 处 理 ， 其 仅仅 是 两 个 字符 \ 和 n。 只 有 在 反 斜 线 W 后 面 接 的 是 \ 或 单 引号 ”， 其 


当 作 特殊 符号 来 处 理 。 








2. 2. 2 双 引 号 字符 串 








会 被 


























双 引 号 字符 串 和 在 其 它 语言 类 似 。 它 也 是 字符 的 序列 ， 不 同 点 在 于 ， 其 1 


制 字符 ， 或 者 八进制 ， 十 六 进 制 数 的 表示 。 下 有 



































“barney”# 竺 同 于 "barney" 

“hello worldm>” #hello world, 换 行 

“the last character of this string is a quote markN” 
“cokeNtsprite”# coke, a tab( 一 个 制 表 符 ), sprite 














双 引 号 括 起 来 的 。 现 在 ， 反 和 斜 线 可 以 用 来 表示 控 


是 一 些 双 引号 字符 串 的 例子 ; 


双 引 号 中 字符 串 “barmey” 和 单 引 号 字符 串 ?barney 相 同 。 和 数字 一 样 ，0377 只 是 255.0 的 另 一 种 写法 。Pezl 允许 你 以 一 种 更 











有 意义 的 方式 来 



































多 最 近 Perl 中 引进 了 Unicode 转移 符 ， 我 们 这 里 不 演示 它们 





表 2-1 双 引 号 字符 串 中 的 转 义 符 





忆 写 。 当然， 如 果 想 \ 和 之 后 的 字符 成 为 转 义 字符 〈 如 表示 新 行 )， 应 当 使 用 双 引 号 。 


反 和 斜 线 后 接 不 同 的 字符 其 含义 不 同 〈 通 常 称 为 : 转 义 字符 )。 表 2-1 基本 上 列 出 了 所 有 的 争 双 引号 中 的 转 义 字符 。 






































符号 含义 
mm 换行 
Y 回 车 
Y 制 表 符 
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得 formfeed 

yb 退 格 

aa 响 铃 

Ne escape (ASCI 中 的 escape 字符 ) 
07 任何 八进制 值 这 里 是 ，007=bell( 响 铃 ) ) 
7f 任何 十 六 进 制 值 (这 里 是 ，007=bell) 
<C 一 个 控制 符 〈 这 里 是 ，ctrl +c) 

N 反 和 斜 线 

双 引 号 

Y 下 个 字符 小 写 

YL 接着 的 字符 均 小 写 直到 \ 

ua 下 个 字符 大 写 

VU 接着 的 字符 均 大 写 直 到 \E 

\Q 在 non-word 字符 前 加 上 \， 直 到 下 

下 结束 \LAE 和 \Q 











双 引 号 字符 串 妃 一 个 性 质 是 可 进行 变量 内 插 ， 这 是 说 当 使 用 字符 串 时 ， 如 果 字 符 串 中 含有 变量 名 ， 将 由 变量 的 当前 值 替 换 
它 。 我 们 还 没有 介绍 变量 ， 在 本 章 的 后 面 将 继续 讨论 这 个 问题 。 


























和 | 
岂 


























2. 3. 3 字符 串 操 作 符 











字符 串 可 由 . 操作 符 连 接 ( 是 的 ， 只 是 一 个 点 ) 。 它 不 会 改变 任何 字 串 ， 就 像 2+3 不 会 改变 2 或 3 一 样 。 串 联 之 后 的 字符 串 
可 供 以 后 使 用 : 
































“hello”.“world” # 同 于 “helloworld” 
hello”.“:” .“world”# 同 于 “hello world” 
hello world .An” # 同 于 “hello worldvn” 








串联 必须 由 . 操作 符 进 行 。 同 别 的 语言 不 一 样 ， 串 联 可 通过 把 两 个 放 在 一 起 来 达到 。 


























一 个 特殊 的 操作 符 是 字符 串 重 复 操作 符 (sting repetition operatoD ， 由 小 写 的 字母 x 表示 。 这 种 操作 能 把 操作 符 左边 字符 串 
复 操作 符 右边 数字 那么 多 次 ; 








“fred xx3 #“fredfredfred” 
“barney "X (4+1)  # “barney” XS3，barneybarneybarneybameybarney” 
SX14 打 革 际 上 是 “5 元 4 “5559” 


值得 具体 讲解 下 最 后 一 个 例子 。 字 符 串 重复 操作 符 需 要 一 个 字符 串 作 为 左 操作 数 ， 因 此 数字 5 被 转变 为 字符 串 “$”( 在 一 
节 将 详细 讨论 )， 一 个 单字 符 字 符 串 。 这 个 新 的 字符 串 被 复制 4 次 ， 产 生 了 一 个 4 字符 的 字符 串 5555。 如 将 两 个 操作 数 的 
顺序 对 调 下 : 4xS， 将 得 到 字符 串 44444 。 这 表示 字符 串 重 复 操 作 符 不 是 可 交换 的 。 
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复制 次 数 〈 右 操作 数 ) 在 使 用 之 前 会 把 它 转换 为 小 于 等 于 它 的 整数 〈 如 ，4.8 变 为 4)。 重 复 次 数 小 于 1 将 产生 








为 0)。 
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2. 2. 4 数字 和 字符 串 之 间 的 自动 转换 


大 多 数 情况 下 ，Perl 将 在 需要 的 时 候 自动 在 数字 和 字符 串 之 间 转 换 。 
呢 ? 这 完全 依赖 于 标量 值 之 间 的 的 操作 符 。 如 果 操 作 符 《〈 如 +) 需要 数字 ，Perl ; 
字符 串 〈 如 . )，Perl 将 把 提 作 数 当 作 字 符 串 看 待 。 








的 























当 在 需要 数字 的 地 方 使 用 了 学 符 串 《如 ， 乘 法 )，Pezl 将 
样 争 。 因此 “12”* “3” 将 给 出 35。 后 面 的 非 数字 部 分 和 前 面 的 空 























自动 把 


四 版 ) 


性 Ar 


字符 中 











让 


异 





串 《 长 度 


它 怎样 知道 什么 时 候 需 要 字符 串 ， 什 么 时 候 需要 数字 











各 把 操作 数 当 作 数 字 看 待 。 
不 必 担 心 数 字 和 字符 串 的 区 别 ; 使 用 恰当 的 操作 符 ，Perl 将 为 你 做 剩 下 


转换 为 其 等 价 的 数字 ， 就 像 输 入 的 是 十 进 旬 
将 被 去 掉 ， 如 “12fred34”* “3 将 给 出 36 而 不 会 用 任何 











提示 争 。 在 极端 情形 ， 当 一 个 不 含 任何 数字 的 字符 串 将 别 转换 为 0。 如 ， 将 “fed”" 当 作 数 字 来 使 用 时 。 




















镶 用 首 字 符 0 表示 非 十 进 制 值 对 数字 有 效 ， 对 自动 转换 没有 作 / 
































急 除 非 你 使 用 了 warnings, 我 们 将 很 快 讨论 到 。 





























。 使 用 hex (0) 和 ort 0) 来 转换 此 类 字符 串 


如 果 操 作 符 需要 





关 浮 点 数 一 








同样 ， 如 在 需要 字符 串 的 地 方 使 用 了 数字 〈 如 ， 字 符 串 连接 )， 数 字 将 转换 为 字符 串 。 例 如 ， 如 果 你 想 在 乙 后 串 接 5 乘 以 7 





的 结果 争 ， 可 以 这 样 写 : 





38y57 ## 同 于 “2 .35, 焉 “2Z33” 














总 之 ， 一 句 话 ， 不 用 担心 使 用 的 是 数字 还 是 字符 串 〈 大 多 数 情况 下 )。Penl 将 自动 转换 它们 拿 。 

















镶 不 用 担心 效率 问题 。Perl 能 记 住 转换 的 结果 ， 











天 





此 这 一 步 只 做 一 次 。 





2. 3 Perl 内 扒 的 警告 (warnings) 


SS 





$perl-w my_program 





或 者 ， 如 果 一 直 都 需要 警告 (warning), 可 以 在 #! 这 一 行 加 上 -w， 如 : 








#! /usYbin/perl 一 w 





这 条 命令 其 至 在 non-Unix 系统 中 也 有 效 ， 由 
blei@163.com 














程序 中 包含 可 能 的 错误 时 ， 可 以 要 求 Per 警告 你 。 
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运行 程序 时 ， 可 以 在 命令 行 中 使 用 




















w 这 个 参数 把 警告 打开 ; 








于 在 这 些 系统 中 通常 与 Perl 的 具体 路 径 关 系 不 大 ， 因 此 可 如 下 书写 ; 
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#! Perl 一 W 











争 wainings progma 允许 文字 上 的 和 警告。 你 可 以 在 pelllexwarn 的 用 户 手 册 


#! /usrbin/perl 
Use warnings; 





在 Perl5.6 或 之 后 的 版 本 中 ， 可 以 使 用 pragma 来 打 





于 警告 (warning).( 注 意 ， 











现在 ， 如 果 将 '12fred34: 当 作 数 字 来 用 ，Perl 将 警告 你 : 


Argument“l2fred34”isn'tnumeric 


当然 ， 警 


ee 恬 抱 怨 可 能 出 错 外 ， 





通过 它 可 以 看 到 更 详细 perldiag 的 mangage 





#! /usrbin/perl 


use diagnostics; 





当 把 use diagnostics 加 入 程序 后 ， 
存 )， 使 在 当 Perl 发 现 错误 时 ， 











取消 阅读 这 些 文档 已 经 足够 。) 





另 一 种 优化 方法 是 ,在 命令 
激活 diagnostics: 


$perl-Mdiagnostics ./my_program 


对 普通 用 户 则 没什么 用 处 。 如 果 程 序 员 没 
不 会 改变 程序 的 行为 。 如 果 看 到 不 能 
Ph 有 对 短 的 warning( 和 警告 ) 和 长 的 diagnostic 《〈 诊 


在 每 次 调 入 程序 时 ， 它 好 象 暂 停 
你 能 迅速 的 读 其 文档 ， 如 果 有 的 话 


行 中 使 用 -M 这 个 参数 ， 仅 当 需 要 diagnostics 时 才 月 


它 对 早期 的 Perl 版 本 无 效 ) 争 。 


找到 详细 信息 。 




















没有 看 到 警告 没 使 用 警告 )， 这 并 没什么 好 处 。 
理解 的 警告 信息 ， 可 以 使 用 diagnostics pragma 






































Argument “1l2fred34”isn'tnumeric in addition(+) at ./m_program line 17 (#1l) 
(W numeric) The indicated String was fed as an argument to 
an operator that expected anumeric value instead. If you Te 
fortunate the message will identify which operator was So Unfortunate. 














出 代码 中 可 能 警告 





我 们 将 指 


2. 4 标量 变量 





变量 是 保存 一 





能 还 有 一 个 值 。 但 其 它 





争 如 你 所 见 ， 标 量变 量 仅 











ZIR 是 


的 地 方 。 但 在 现今 版 本 中 的 警告 信息 


个 或 多 个 值 的 容器 争 。 变 量 的 名 字 在 整 








咖 
山 | 




















个 程序 中 保持 不 变 ，{ 











了 一 会 儿 。 那 是 因 
。 这 导致 了 一 种 对 Penl 程序 优化 的 方法 ， 当 不 需要 读 警 
告 信 息 相 关 的 文档 时 ， 将 use diagnostics 去 掉 。( 当 然 如 果 能 修改 程序 ， 把 引起 警告 的 原因 去 掉 ， 那 是 最 好 不 过 了 。 但 只 是 


日 ， 而 不 用 每 次 通过 


其 包含 的 值 


仗 断 ) 的 描述 。 











为 Perl 做 了 大 量 的 工作 《〈 占 去 大 块 内 





























寸 修改 源 代 码 来 决定 是 否 














和 将 来 版 本 可 能 不 同 。 








可 以 变化 。 

















如 数组 或 哈 希 (hash) ,可 以 含有 多 个 值 。 











一 个 美圆 符号 〈$) 后 接 Perl 标识 




















标量 变量 可 以 存放 一 个 标量 值 。 标 量变 量 的 名 字 有 日 
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数字 ,或 者 下 划 线 。 或 者 说 由 字母 ， 数 字 和 下 划 线 组 成 ， 但 不 能 由 数字 开头 。 大 小 写 是 严格 区 分 的 : 变量 $Fred 和 变量 $fred 
是 不 同 的 。 任 意 字 母 ， 数 字 ， 下 划 线 都 有 意义 ， 如 : 








$a_very_long_variable_that _ends_in_1 


和 变量 : 


$a_very_long_variable_that _ends_in_ 2 


是 不 同 的 。 












































标量 变量 在 Perl 中 由 $ 开 头 争 。 在 shell 中 ， 当 取 值 时 ， 需 要 $;， 赋 新 值 时 ， 不 需要 $。 在 awk 和 C 中 ， 完 全 不 需要 $。 如 果 
你 在 这 这 几 种 语言 中 来 回 切换 的 话 ， 你 很 可 能 经 常 出 错 。 这 是 很 正常 的 。( 大 多 数 Perl 程序 员 推 荐 在 写 Perl 程序 时 停止 书 
写 shell, awk，C 程序 ， 当 然 是 否 采纳 ， 由 你 自己 决定 )。 



























































急 按 照 Perl 的 行 话 来 讲 ， 被 称 作 “sigil”。 


通常 ， 应 当选 择 能 很 好 描述 你 的 意图 的 变量 名 。 例 如 ， 变 量 和 就 不 如 $line_length 描述 性 强 。 如 果 一 个 变量 只 在 相 临 几 行 中 
使 用 ， 那 可 以 取 个 像 $n 这 样 的 名 字 ， 但 如 果 变 量 要 在 整个 程序 中 使 用 的 话 ， 最 好 还 是 仔细 的 选择 变量 名 。 























同样 的 ， 仔 细 的 使 用 下 划 线 可 以 使 变量 名 更 易 阅 读 和 理解 ， 特 别 是 维护 你 程序 的 人 和 你 有 不 同 的 母语 背景 时 。 例 如 ， 
$super_bowl 这 个 变量 就 比 $superbowl 好 些 , 因为 后 者 可 能 被 理解 为 $gsuperb_owl。 又 如 $stopid 是 $sto_pid (保存 一 个 进程 ID )， 
还 是 $s_to_pid( 将 某 个 东西 转变 成 进程 ID)， 或 是 $stop_id(estop" 对 象 的 ID)， 或 者 仅仅 是 $stupid 的 错误 拼写 ? 














大 多 数 Perl 程序 中 的 变量 都 是 小 号 的 ， 和 你 在 本 书 中 见 到 的 一 样 。 在 少数 情况 下 ， 使 用 大 写字 母 。 所 有 字母 均 大 写 〈 如 
$ARGV ) 通常 表明 这 个 变量 有 特殊 的 地 方 。 当 一 个 变量 有 超过 一 个 单词 时 ， 一 些 人 使 用 $underscores_are_cool 这 种 形式 ， 
另 一 些 人 使 用 $giveMeInitilalCaps 这 种 形式 。 无 论 采取 那 种 ， 请 保持 风格 一 致 。 
































当然 ， 变 量 名 字 的 好 坏 对 Peadl 没有 任何 影响 。 如 你 可 以 把 三 个 重要 的 变量 命名 为 : $ooooooooo, $oooooooo, $oooooooooo， 
Perl 不 会 弄 错 。 但 是 ， 如 果 这 样 ， 请 不 要 让 我 们 维护 你 的 代码 @。 



































2. 4. 2 标量 赋值 


标量 变量 最 通常 的 操作 是 赋值 : 将 值 赋 给 变量 。Penl 中 的 赋值 符 是 等 号 《和 许多 语言 类 似 )， 将 等 号 右边 的 值 赋 给 等 号 左边 
的 变量 ; 























$fred = 17; # 属 17 赋 给 变量 $fred 
$barney ='hello"; # 将 五 个 字母 的 字符 串 hello" 赋 给 $barney 
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$barney = $fred + 3 间 将 $fred 的 值 加 上 三 赋 给 $barney (20) 
$barney= $barney*2:## 任 变量 $barney 乘 2 再 赋 给 $barney (40) 




















注意 最 后 一 行 中 $barney 变量 使 用 了 2 次 : 一 次 从 中 取 值 〈 等 号 右边 ) 一 次 作为 赋值 的 对 象 〈 等 号 左边 )。 这 是 合法 的 ， 安 
全 的 ， 且 普遍 使 用 。 事 实 上 和 它 如 此 常用 ， 以 致 Perl 提供 了 一 种 简便 写法 ， 你 将 在 下 一 节 中 了 解 到 。 

















2. 4. 3 二 元 赋值 操作 符 





像 $fred=$fred+3 〈 同 一 个 变量 在 赋值 符 两 边 出 现 ) 这 样 的 表达 式 在 Perl 中 经 常 出 现 《〈 同 C 和 Java 类 似 )， 因 此 Perl 提供 了 
一 种 简便 的 替代 方法 : 二 元 赋值 操作 符 。 几 乎 每 一 个 二 元 操作 符 都 有 一 个 等 价 的 二 元 赋值 形式 : 由 这 个 符号 后 接 等 号 组 成 。 
例如 ， 下 面 两 行 是 等 价 的 : 












































$fred = $fred + 5; 礁 必 有 用 二 元 赋值 操作 符 
$fred+=5; # 利 用 二 元 赋值 操作 符 








下 面 的 也 是 等 价 的 : 











$barney = $barney*3; 
$barney*=3; 





上 述 两 例 中 ， 变 量 借助 自身 而 非 别 的 变量 来 改变 自身 的 值 。 





























另 一 个 常用 的 赋值 操作 符 是 字符 串 连 接 符 号 〈.);， 其 赋值 形式 为 (.=): 











$str = str “7 耕 str 后 接 空 格 
人 # 同 上 


2. Sprint 输出 


通常 ， 应 该 让 你 的 程序 有 输出 ， 是 一 个 好 主意 ， 和 否则， 别人 可 能 认为 程序 什么 事 也 没 做 。printO 能 完成 这 种 工作 。 它 把 一 个 
标量 参数 作为 参数 ， 再 把 它 不 做 修改 的 输出 来 。 除 非 做 了 某 些 修改 ， 和 否则 其 默认 的 输出 是 终端 《显示器 ): 














Print “hello worldvn”; 才 险 出 hello world， 后 接 换行 符 
Print “The answer is ”; 

0 

Print “no”; 





也 可 以 将 一 串 值 赋 给 print， 利 用 去 号 分 开 : 





Print “The answer 1S ,0*7， AND ; 
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这 是 列表 ， 但 我 们 还 没 讨 论 到 列表 ， 这 将 以 后 解释 。 














2. 5. 1 字符 串 中 标量 变量 的 内 插 


一 个 字符 串 由 双 引 号 括 起 来 时 ， 如 果 变 量 前 没有 反 和 斜 线 ， 则 变量 会 被 其 值 内 插 合 。 也 就 是 说 字符 串 中 的 标量 变量 争 将 被 
值 替 换 。 











泊 卜 

















急 这 和 数学 或 统计 学 中 的 内 插 含义 是 不 同 的 














急 还 有 一 些 其它 的 变量 类 型 ， 在 后 面 章 节 中 将 看 到 


























$mean = “brontosaurus steak”; 








$barney = “fred ate a$meal” ， 考 barney 现在 是 “fred ate a brontosaurus steak” 
$barney = fredate ia . $meal;  # 同 上 




















从 上 上 面 得 知 ， 不 使 用 双 引 号 也 可 以 得 到 相同 的 结果 。 但 使 用 双 引 号 更 方便 些 。 



































如 果 一 个 变量 未 被 赋值 ， 则 将 使 用 空 值 替 换 ; 

















急 这 是 一 种 特殊 的 未 定义 值 ，undef。 在 本 章 后 面 将 介绍 到 。 如 果 开 启 了 警告 ，Perl 将 提示 你 内 插 的 变量 未 定义 〈 未 初始 化 )。 























$barney = fred ate a $meat” 考 barey 现在 是 “fred atea ”; 











如 果 使 用 的 是 单独 一 个 变量 ， 是 否 使 用 引号 没有 影响 。 如 ; 








print“$fred”; 反 3 号 是 没有 必要 的 
print $fred; # 更 好 的 写法 












































将 单独 的 一 个 变量 使 用 引号 括 起 来 没有 错误 ， 但 别 的 程序 员 可 能 会 笑 你 争 。 变 量 内 插 通常 也 叫做 双 引 号 内 插 ， 因 为 它 在 双 
引号 中 《而 非 单 引号 ) 才 有 效 。 在 某 些 别 的 字符 串 中 也 可 能 被 内 插 ， 遇 到 它们 时 再 讲解 。 






































镶 是 的 ， 可 能 将 其 值 作为 字符 串 而 非 数字 看 待 。 在 极 少数 情况 下 ， 是 需要 引号 的 。 但 几乎 大 多 数 情况 都 是 浪费 笔 黑 。 








在 字符 串 中 变量 前 〈$ 符 号 前 ) 加 上 反 斜 线 O， 变 量 将 不 会 被 内 插 〈 蔡 换 ); 








$fred = hello'"; 
print “The name is \$fred \”; 。# 打 印 出 美圆 符号 ， 变 量 不 会 被 其 值 蔡 换 
print The name is $fred “mn”; # 同 上 





























变量 名 将 是 字符 串 中 有 意义 的 最 长 的 那 一 个 。 这 可 能 在 当 你 需要 在 某 次 匹配 就 替换 的 情况 下 出 问题 。Perl 提供 了 一 种 类 似 
于 shell 的 分 隔 符 : 花 括号 ({))。 用 人 花 括号 将 变量 名 括 起 来 。 或 者 将 字符 串 分 隔 成 几 个 部 分 ， 再 用 连接 符 (. ) 串 起 来 























$what = “brontosaurus Steak”; 
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$n = 3; 

print“fred ate $n $whatsm”; # 不 是 steaks， 而 是 $whats 的 值 
print“fred ate $n ${whatjs7”; # 现 在 是 使 用 变量 $what 
print“fred ate $n $what” “Sn”; # 另 一 种 方法 





print fred ate  . $n . ….$what “sm  # 一 种 复杂 的 方法 


2. 5. 2 操作 符 优 先 级 和 结合 性 



































操作 符 的 优先 级 规定 哪 部 分 先进 行 预算 。 例 如 ,表达 式 2+3 兰 ， 是 先进 行 加 呢 还 是 先进 行 乘 ? 如果 先进 行 加 ,得 到 5*4，20。 
如 果 先 进行 乘 〈 同 数学 课 中 学 到 的 一 样 )， 将 得 到 2+12， 等 于 14。 笠 运 的 是 ，Perl 中 的 定义 和 数学 上 的 一 样 ， 先 进行 乘 。 




















可 以 使 用 括号 来 改变 优先 级 。 括 号 中 的 表达 式 将 首先 被 计算 《和 数学 课 中 学 到 的 一 样 )。 因 此 ， 如 果 想 加 法 
j (2+3)* 4， 得 到 20。 如 果 想 先进 行 乘 ， 可 以 使 用 2 + (3 状 )， 当 然 此 时 括号 不 是 必需 的 。 



































由 此 ， 我 们 可 以 说 乘法 比 加 法 的 优先 级 更 高 。 






























































\ 






































E 进 行 ， 可 以 使 


乘法 和 加 法 的 优先 级 是 比较 容易 确定 的 ， 但 字符 串 连 接 符 和 蝴 运 算 的 优先 级 就 不 是 那么 明显 的 。 恰 当 的 方法 是 查看 Perl 的 


优 


了 


和 











级 表 ， 如 表 22 银 .〈 一 些 操 作 符 没 在 此 表 中 列 出， 要 查看 详细 信息 ， 可 参考 Perl 的 用 户 手 册 ) 。 








急 C 和 Perl 中 都 有 的 操作 符 有 相同 的 优先 级 ， 这 对 C 程序 员 是 一 个 好 消 


证 


表 2-2 操作 符 的 优先 级 和 结合 性 〈 由 高 到 低 ) 








站 


械 


操作 符 





括号 和 列表 操作 符 的 参数 





导 | 导 | 盒 


-> 





++ --( 自 增 和 上 自 减 ) 








米 米 








\1~ + - (一 元 操作 符 ) 








关 /205 





+-: (二 元 操作 符 ) 





时 | 各 | 和 | 半 | 寺 | 填 


<<< >>> 





Named unary operators (-X filetests, rand) 





<<=>>=ltle gtge(“ 不 等 的 ”) 





== !=<=>eqne cmp(“ 相 等 的 ”) 








| 人 





XXX 





时 | 肝 计 这 











右 








?:( 三 元 操作 符 ) 
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右 = += 三 = 
左 三 
List operators(rightward) 
右 not 
左 And 
左 OT XOT 

















上 表 中 ， 上 面 的 操作 符 比 下 面 的 操作 符 优先 级 更 高 。 









































同 优先 级 类 似 ， 结 合 性 是 
4#4 汪 44# 了。 提 4## 《3#k#2 ) 
72/12/3 失 (72/12)/3 
36/6*3 扩 36/6)#3 





























那么 ， 需 要 记 住 优先 级 表 吗 ? 不 需要 ! 
其 优先 级 顺序 ， 那 很 可 能 程序 的 多 


























2. 5. 3 比较 运算 符 


一 过 二 1 


对 于 数字 的 比较 ，Perl 提供 了 < 








更 多 。 其 中 一 些 可 能 和 你 在 别 的 语言 中 学 到 的 不 一 样 























使 用 >= 而 非 => 作为 “大 于 等 于 ”也 是 由 于 => 有 其 它 用 途 。 
的 。 














对 于 字符 串 比较 ，Perl 有 如 下 的 一 些 有 趣 的 字符 串 比 较 符 : ltle eq ge gtne。 它 们 将 一 个 字符 接着 一 个 字符 的 比较 两 个 串 
在 ASCI 中 ， 大 写字 母 在 小 写字 母 的 前 面 )。 


AAA 


判断 它们 的 关系 : 相等 ， 小 于 ， 等 等 








。 (注意 ， 








比较 运算 符 《〈 数 字 的 和 字符 串 的 )， 列 在 胡 2-3 中 。 








在 第 一 条 中 ， 关 是 右 结合 的 ， 所 以 右边 的 先进 行 计算 。 同 样 的 ， 由 





同一 优先 级 的 操作 符 由 结合 怡 

















护 者 也 记 不 住 。 因 此 ， 应 当 善 待 


!= 这 些 操作 符 。 每 一 种 返 


。 例 如 : == 











j 来 规定 有 相同 优先 级 的 操作 符 的 计算 顺序 : 
































日 等 ，= 赋值 != 





碍 实 上 没有 人 那样 做 。 如 果 记 不 住 优先 级 时 ， 可 以 使 用 括 
他 /她 ， 因 为 那个 人 很 可 能 就 是 你 ! 


本 
\ 等 ， 














表 2-3 ”数字 和 字符 串 的 比较 运算 符 


来 决定 计算 顺序 。 


于 * /是 左 结合 的 ， 所 以 左边 的 先进 行 运算 。 




















卫 


回 的 值 为 true 或 者 false。 在 下 一 节 





号。 毕竟 ， 如 果 你 不 知道 


中 将 了 解 到 




















因为 <> 在 Perl 中 有 别 的 用 途 。 





对 实 上 ， 绝 大 多 数 符号 的 组 合 在 Perl 中 都 是 有 特殊 用 ; 











途 














来 





















































比较 关系 数字 字符 串 

相等 写 全 eq 

不 等 全 ne 

小 于 去 L 

大 于 冯 &t 

小 于 或 等 于 <= le 

大 于 或 等 于 >= ge 

下 面 是 一 些 关 于 比较 运算 符 的 例子 : 
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335 != 30+5 #false 
35=35.0 #true 
35" eq '35.0， #false (按照 字符 串 比较 ) 
fred lt barney” 禁 alse 


站 ed 上 ee 并 rue 
fred eq fred” 拱 rue 
ET 霸 false 
本 ##true 


2. 6 让 控制 结构 





一 旦 能 比较 两 个 值 时 ， 就 希望 能 根据 这 些 比较 结果 作 判 断 。 和 别 的 语言 类 似 ，Perl 中 也 提供 了 庄 控 制 结构 : 








这 ($name gt fred”){ 


66 6 


print“ '$name'” comes after 'fred' in Sorted orderNm”; 


} 





如 果 需 要 另 一 种 选择 ， 可 以 使 用 关键 字 else: 





if($name gt fred 7 ){ 


Print ““$name'” comes after ' fred in sorted orderNm ”; 
}else{ 
Print ““$name'” does not come after fred No”; 


Print “Maybe its the Same string, in factn ; 


} 





花 括 号 是 必须 的 〈 这 一 点 和 C 不 同 )。 将 块 中 的 代码 缩 进 是 一 个 好 主意 ; 这 样 将 使 代码 易于 阅读 。 如 果 使 用 的 是 程序 员 编 
辑 器 〈 参 见 第 一 童 )， 它 将 为 你 自动 完成 许多 事 。 























2 6. Boolean 值 














在 计 控 制 结构 的 条 件 判 断 部 分 可 以 使 用 任意 的 标量 值 。 这 在 某 些 时 候 将 很 方便 ， 如 : 

















$is_bigger = $name gt fred”; 
if($is_bigger){.…】} 








那么 , Perl 是 怎么 判断 其 值得 true 或 false 呢 ? Perl 不 同 于 其 它 的 一 些 语言 , 它 没 有 Boolean 类 型 。 它 利用 如 下 几 条 规则 争 : 

















镶 事 实 上 Perl 不 是 用 的 这 些 规 则 ， 但 你 可 以 利用 它们 方便 记忆 ， 其 结果 是 一 致 的 。 








T 
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@@ 如 果 值 为 数字 ，0 是 false; 其 余 为 真 

















@@ 如 果 值 为 字符 串 ， 则 空 串 (?) 为 false; 其 余 为 真 






































@@ 如 果 值 的 类 型 既 不 是 数字 又 不 是 字符 串 ， 则 将 其 转换 为 数字 或 字符 串 后 再 利用 上 述 规则 镶 。 

















急 这 意味 着 undef 〈 很 快 会 看 到 ) 为 false。 所 有 的 引用 《〈 在 Alpaca 书 中 有 详细 讨论 ) 都 是 true。 














这 些 规则 中 有 一 个 特殊 的 地 方 。 由 于 字符 串 '0' 和 数字 0 有 相同 的 标量 值 ，Perl 将 它们 相同 看 待 。 也 就 是 说 字符 串 '0'` 是 唯一 
一 个 非 空 但 值 为 0 的 串 。 






































如 果 想 得 到 相反 的 值 ， 可 以 使 用 一 元 非 运 算 符 ! 。 如 果 其 后 面 的 是 tue， 则 得 到 false; 反之 ， 则 得 到 true: 








f(!$if_ biggen{ 
# 当 $if bigger 非 真 时 ， 运 行 此 代码 
} 


2. 7 用 户 输入 


现在 ， 可 能 想 你 的 Perl 程序 怎样 才能 从 键盘 上 得 到 输入 呢 ? 有 一 种 简单 方法 : 使 用 行 输入 操作 符 (line-input operaton)， 
<STDIN>@。 





























是 行 输入 运算 符 对 文件 句柄 STDIN 的 操作 。 但 直到 第 五 章 才 介绍 文件 句柄 。 























<STDIN> 作 为 标量 值 来 使 用 的 ，Perl 每 次 从 标准 输入 中 读 入 文本 的 下 一 行 ， 将 其 传 给 <STDIN>。 标 准 输入 可 以 有 很 多 种 ; 
默认 的 是 键盘 。 如 果 还 没有 值 输入 <STDIN>，Perl 会 停 下 来 等 你 输入 一 些 字符 ， 由 换行 符 结束 (return ) 争 。 






























































































































































久 坦 白 讲 ， 是 你 的 系统 等 待 输入 ，Perl 等 待 你 的 系统 。 有 具体 的 细节 与 机 器 和 配置 有 关 。 由 于 是 系统 而 非 Perl 控制 你 的 输入 ， 因 此 要 更 正 错 
误 的 输入 通常 可 以 在 按 下 回 车 前 使 用 退 格 键 〈backspace) 。 如 果 想 更 多 的 控制 输入 ， 可 以 使 用 Term::ReadLine 这 个 模块 ， 在 CPAN 中 可 
以 下 载 到 。 
<STDIN> 中 的 字符 串通 常 由 一 个 换行 符 作 为 结尾 争 。 因 此 ， 可 以 如 下 操作 : 


























镶 例 外 的 情况 是 ， 标 准 输入 流 在 行 中 间 就 结束 了 。 当 然 ， 普 通 的 文本 文件 通常 不 是 这 样 。 


























$line = <STDIN>; 
if($line eq An”){ 

print “IThat was just a blank lineln ; 
jelse{ 


Print“That line of input was: $line”; 





实际 上 ， 通 党 你 不 需要 保留 换行 符 ， 因 此 需要 chomp 来 去 掉 它 。 
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2. 8 chomp 操作 











第 一 次 读 到 chomp 函数 时 , 它 看 起 来 过 于 专门 化 。 它 对 变量 起 作用 , 而 此 变量 含有 字符 串 。 如 果 字 符 串 结尾 有 换行 符 , chomp 
可 以 去 掉 它 。 这 基本 上 就 是 它 能 完成 的 所 有 功能 ， 如 下 例 ; 














$text = aline oftextvn;， # 也 可 以 由 <STDIN> 输 入 
chomp($texb; # 去 掉 换 行 符 (n)。 


























它 非常 有 用 ， 基 本 上 你 的 每 一 个 程序 都 会 用 到 它 。 如 你 将 知道 ， 这 是 将 字符 串 末 尾 换行 符 去 掉 的 最 好 方法 。 基 于 Perl 中 的 
一 条 基本 原则 : 在 需要 使 用 变量 的 地 方 ， 可 以 使 用 赋值 表达 式 来 代替 。 我 们 有 更 简单 的 使 用 chomp 的 方法 。Perl 首先 做 赋 
值 运算 ， 再 使 用 这 个 变量 。 因 此 使 用 chomp 的 最 常用 方法 是 : 















































chomp ($text = <STDIN>); # 读 入 ， 但 不 含 换行 符 


$text = <STDIN>， 
chomp ($textb); # 同 上 ， 但 用 两 步 完 成 








第 一 眼见 到 时 ， 第 一 种 组 合 的 方法 看 起 来 复杂 些 。 如 果 把 上 述 其 看 成 两 步 操作 ， 读 一 行 再 chomp， 那 写成 两 个 语句 的 方法 
看 起 来 自然 些 。 如 果 将 其 看 作 一 个 操作 ， 读 入 一 行 但 不 包括 换行 符 ， 那 写成 一 个 语句 的 方法 更 恰当 。 由 于 绝 大 多 数 Perl 程 
序 员 使 用 第 一 种 写法 ， 你 也 应 该 使 用 它 。 



























































chomp 是 一 个 函数 。 作 为 一 个 函数 ， 它 有 一 个 返回 值 ， 为 移 除 的 字符 的 个 数 。 这 个 数字 基本 上 没什么 用 : 








$food = <STDIN>; 
$betty = chomp $food; # 得 到 值 1 
































如 上 ， 在 使 用 cnomp 时 ， 可 以 使 用 或 不 使 用 括号 〈)。 这 又 是 Perl 中 的 一 条 通用 规则 : 除非 移 除 它们 时 含义 会 变 ， 和 否则 括 
号 是 可 以 省 略 的 。 


如 果 结 尾 有 两 个 或 两 个 以 上 的 换行 符 争 ，chomp 仅 去 掉 一 个 。 如 果 没 有 ， 那 什么 也 不 做 ， 返 回 0。 

















急 这 种 情况 在 一 次 读 入 一 行 时 不 会 发 生 ， 但 使 用 了 输入 分 隔 符 (input separatonD 〈$/)〈 其 不 为 换行 符 (n))，read 函数 ， 或 者 将 一 些 字符 串 结 
合 起 来 就 有 可 能 发 生 。 




















2. 9 while 控制 结构 























和 许多 的 程序 语言 一 样 ，Perl 也 提供 了 循环 结构 争 。while 语句 可 以 循环 执行 其 内 部 的 一 块 代码 直到 其 条 件 非 真 : 




















急 基 本 上 每 个 程序 员 都 有 创建 过 无 限 循环 语句 的 经 历 。 如 果 程 序 不 停 的 运行 ， 你 可 以 像 关 闭 系统 中 别 的 程序 那样 来 关闭 Perl 程序 。 通 常 
是 使 用 CTRL+C;， 检查 你 的 系统 文档 来 了 解 具体 的 信息 。 
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$count = 0; 
while ($count < 10) { 

$count + = 2; 

print“count is now $countn 汪 # 打 印 出 2 4 6 8 10 
} 








条 件 中 真 假 值 的 判断 和 让 结构 中 是 一 样 的 。 和 站 控 制 结构 相同 ， 花 括号 是 必须 的 。 判 断 条 件 在 迭代 前 执行 ， 如 果 条 件 为 假 ， 
则 一 次 也 不 执行 。 


2. 10 undef 值 








在 变量 被 赋值 之 前 使 用 它 会 有 什么 情况 发 生 呢 ? 通常 不 会 有 什么 严重 的 后 果 。 变 量 在 第 一 次 赋值 前 有 一 个 特殊 值 undef, 按 
照 Perl 来 说 就 是 :“ 这 里 什么 也 没有 ,请 继续 ”。 如果 这 里 的 “什么 也 没有 ”是 一 些 “ 数 字 ” 则 表现 为 0。 如 果 是 “字符 串 ” 
则 表现 为 空 串 。 但 undef 既 非 数字 也 非 字 符 串 ， 它 是 另 一 种 标量 类 型 。 


































































































昌 于 undef 在 需要 数字 的 地 方 可 以 自动 转化 为 0， 因此 可 以 如 下 的 写 代码 ; 











# 将 一 些 基 数 相 加 
#n = 1]1; 
while($n < 10){ 
$sum += $n; 
$n +=2; 间 下 一 个 奇数 
} 


print“The total was $sumwNn”; 








上 述 代码 在 $sum 未 初始 化 (undeb 时 也 能 正确 执行 。 第 一 次 执行 时 ， 循 环 体 中 第 一 行 $n 值 为 1， 因 此 将 1 加 给 $sum。 而 $sum 
就 像 已 经 有 值 0， 因 为 $sum 值 为 undef。 现 在 其 值 1。 之 后 ， 由 于 其 已 被 初始 化 ， 其 过 程 同 普通 的 类 似 。 



















































































同样 的 ， 针 对 字符 串 的 情形 : 
$string .= “more textn”; 


如 果 $string 为 undef， 则 是 空 串 后 接 “more textn”。 反 之 ， 则 是 其 值 后 接 “more text\n”。 











Perl 程序 员 在 使 用 新 变量 时 ， 经 常 不 初始 化 ， 从 而 将 变量 作为 0 或 者 空 串 使 用 。 











许多 操作 当 参 数 不 恰 当时 返回 undef。 如 果 没 做 特殊 处 理 ， 通 常会 得 到 0 或 者 空 串 。 实 践 中 ， 这 几乎 不 会 有 什么 问题 。 实 际 
上 ， 许 多 程序 员 利 用 这 种 性 质 。 但 应 当知 道 如 果 警 告 是 打开 的 ， 那 Perl 在 你 不 恰当 的 使 用 未 定义 值 时 会 提醒 你 。 例 如 ， 将 
一 个 undef 的 变量 赋 给 另 一 个 变量 不 会 有 什么 问题 ， 但 如 果 print 某 个 未 定义 的 值 则 将 引起 警告 。 
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2. 1. 1 defined 函数 





























能 返回 undef 的 操作 之 一 是 行 输入 操作 ，<STDIN>。 通 常 ， 它 会 返回 文本 中 的 一 行 。 但 如 果 没 有 更 多 的 输入 ， 如 到 了 文件 
的 结尾 ， 则 返回 undef 争 。 要 分 状 其 是 undef 还 是 空 串 ,可 以 使 用 defined 函数 ， 它 将 在 为 undef 时 返回 false， 其 余 返 回 true。 





























多 事实 上 ,从 键盘 输入 , 不 会 有 “end-offile”, 但 其 可 重 定向 到 文件 中 再 输入 。 或 者 用 户 可 能 输入 某 些 键 ， 而 系统 将 其 作为 end-of-file 看 待 。 











$madonna = <STDIN>; 
开 ($defined ($madonnay)){ 
Print“The input was $madonna”; 
jelse{ 
Print "No input availablel\n ; 


} 





如 果 想 声明 自己 的 undef 值 ， 可 以 使 用 undef: 

















$madonna = undef ; # 同 $madonna 从 未 被 初始 化 一 样 





下 


O 


2. 1. 2 练习 








答案 请 参考 附录 A， 
1. [9] 写 一 个 程序 ， 计 算 半 径 为 12.5 的 圆 的 周 长 。 圆 周 长 等 于 2r 〈z 约 为 3.141592654) 乘 以 半径 。 答 案 为 78.5。 

















2. [修改 上 述 程序 ， 用 户 可 以 在 程序 运行 时 输入 半径 。 如 果 ， 用 户 输入 12.5， 则 应 得 到 和 上 题 一 样 的 结果 。 


3 纪 修 改 上 述 程序 ， 当 用 户 输入 小 于 0 的 数字 时 ， 程 序 输 出 的 周 长 为 0， 而 非 负数 








4 [8] 写 一 个 程序 ， 用 户 能 输入 2 个 数字 《不 在 同一 行 )。 输 出 为 这 两 个 数 的 积 





























5 [8] 写 一 个 程序 ， 用 户 能 输入 1 个 字符 串 和 一 个 数字 (mD《〈 不 在 同一 行 )。 输 出 为 ，n 行 这 个 字符 串 ，1 次 1 行 〈 提 示 ， 使 
用 “x” 操 作 符 )。 例 如 ， 如 果 用 户 输入 的 是 “fred” 和 “3”, 则 输出 为 : 3 行 ， 每 一 行 均 为 fed。 如 果 输 入 为 “fred” 和 
“299792” 则 输出 为 299792 行 ， 每 一 行 均 为 fred。 
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第 三 章 列表 和 数组 





如 果 把 标量 认为 是 Perl 中 的 单数 的 话 ， 如 我 们 在 第 二 童 开 头 讨论 的 ， 那 列表 (lisp 和 数组 则 可 认为 是 Perl 中 的 复数 。 


























列表 是 标量 的 有 序 集 。 数 组 是 包含 列表 的 变量 。 在 Perl 中 这 个 两 个 术语 是 可 以 互 换 的 。 但 严格 意义 上 讲 ， 列 表 是 指数 据 ， 
而 数组 是 其 变量 名 。 可 以 有 一 些 值 〈 列 表 ) 但 不 属于 数组 ;但 每 一 个 数组 标量 都 有 一 个 列表 ， 虽 然 其 可 以 为 空 。 图 3-1 是 
一 个 列表 ， 无 论 其 是 否 存储 在 一 个 数组 中 。 

































































图 3-1 ”一 个 有 五 个 元 素 的 列表 

















值 
0 |35 
索 1 1124 
2 | “hello” 
引 3 | 172e30 
4 “byeNn” 


















































列表 中 每 一 个 元 素 都 是 一 个 独立 的 标量 值 。 这 些 值 是 有 顺序 的 ， 也 就 是 说 ， 这 些 值 从 开头 到 最 后 一 个 元 素 有 一 个 固定 的 序 
列 。 数 组 或 者 列表 中 的 元 素 是 编 了 号 的 ， 其 索引 从 整数 0 开始 争 ， 依 次 增 一 ， 因 此 数组 或 者 列表 第 一 个 元 素 的 索引 为 0。 






















































































合 数 组 或 者 列表 在 Perl 中 的 索引 总 是 从 0 开始 ， 这 和 某 些 语言 不 同 。 在 Perl 的 早期 版 本 中 ， 是 可 以 改变 数组 列表 初始 索引 值 的 〈 不 只 对 一 
个 数组 或 列表 而 是 一 次 针对 所 有 的 )。Larry 后 来 发 现 这 是 个 错误 的 功能 ， 其 应 用 也 让 人 失望 。 但 是 ， 如 果 你 特别 感 兴趣 的 话 ， 可 以 参 
看 perlvar 用 户 手册 中 的 $[ 变 量 。 






















































































于 每 一 个 元 素 是 一 个 独立 的 标量 值 ， 因 此 一 个 列表 或 者 数组 可 以 包含 数字 ， 字 符 串 ，undef 值 ， 或 者 任意 不 同类 型 的 标量 
值 的 组 合 。 然 而 ， 这 些 元 素 的 类 型 通常 是 一 致 的 ， 例 如 关于 书 名 的 列表 《〈 值 均 为 字符 串 )， 关 于 余 弱 的 列表 《〈 值 均 为 数字 )。 




































































列表 和 数组 可 以 包含 任意 数量 的 元 素 。 最 少 含有 0 元 素 ， 最 多 可 以 填 满 你 的 可 用 内 存 。 这 里 又 体现 了 Perl 的 设计 哲学 “ 没 
有 不 必要 的 限制 ” 
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3. 1 工 访问 数组 元 素 


如 果 你 使 用 过 其 它 语言 的 数组 ， 那 对 于 Perl 可 以 通过 索引 值 来 访问 元 素 的 做 法 不 会 觉得 奇怪 。 








数组 中 的 元 素 是 由 连续 整数 编 了 号 的 ， 其 从 0 开始 ， 每 增加 一 个 元 素 ， 其 索引 值 加 一 ， 如 : 











$fred[0] =“yabba”” 
$fred[1]=“dabba”; 
$fred[2] = “doo”; 














数组 名 字 (本 例 中 : fred) 和 标 
量 。Perl 将 它们 当 作 完全 不 同 的 
名 )。 





是 属于 完全 不 同 的 命名 衬 间 (namespace)。 同 一 程序 也 可 以 同时 包含 叫做 $fred 的 标量 变 
物 来 看 待 ， 不 会 混淆 争 。( 但 维护 人 员 可 能 混淆 ， 所 以 最 好 不 要 将 它们 以 相同 的 名 字 来 命 














急 语 法 总 是 无 二 义 性 的 ;也许 有 些 技巧 ， 但 是 确定 的 。 





可 以 在 任何 争 能 够 使 用 标量 变量 〈 如 $fred ) 的 地 方 使 用 数组 元 素 〈 如 $fred[2] )。 例 如 ， 可 以 使 用 上 一 章 介 绍 的 方法 来 获得 
数组 元 素 的 值 ， 或 者 改变 它 。 


























争 实 际 上 是 绝 大 多 数 。 最 明显 的 例外 是 foreach 循环 中 的 控制 变量 (在 本 章 后 面 将 介绍 到 )， 必须 是 标量 变量 。 还 有 些 例 外 , 如 print 和 printf 
的 “indirect object slof” 和 “indirect filehandle slot”。 
































print $fred[0]; 
$fred[2] = “diddley”; 
$fred[1] .=“whatsis” 














当然 ， 下 标 可 以 是 任何 能 返回 数值 的 表达 式 。 如 果 其 值 不 为 整数 ， 则 自动 将 其 转换 为 小 于 它 的 最 大 整数 值 : 








$number = 2.71828; 
Print $fred[$number-1]; # 和 Print $fred[]] 一 样 











如 果 下 标 超 出 了 数组 的 范围 ， 则 其 值 为 undef。 这 和 通常 的 变量 情况 是 一 样 的 ， 如 果 没 有 值 存放 在 变量 中 ， 则 其 为 undef。 














$blank = $fred [142_857] # 此 数组 元 素 未 存放 值 ， 得 到 undef 
$blanc = $mel， #$mel 未 存放 值 〈 未 初始 化 )， 得 到 undef 


3， 2 特殊 的 数组 索引 


如 果 将 一 个 元 素 存 储 在 数组 最 后 元 素 的 后 面 的 位 置 ， 数 组 会 自动 增长 的 。Perl 没有 长 度 的 限制 ， 只 要 你 有 足够 的 内 存 。 如 
果 Perl 需要 创建 元 素 ， 则 其 值 为 undef。 




















$rocks[0] = "bedrock”; 本 个 元 索 
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$rocks[1] = “late ”; # 又 一 个 
$rocks[2] = Java'; 间 双 二 个 
$rocks[3] =“crushed rock 浊 又 一 个 
$rocks[99] = “schist”; 丰 见 在 有 95 个 undef 元 素 


有 时 需要 知道 数组 最 后 一 个 元 素 的 索引 。 刚 才 使 用 的 rocks 数组 ， 其 最 后 一 个 元 素 的 索引 为 $#ocks 争 。 这 和 数组 中 元 素 的 











个 数 是 不 同 的 ， 因 为 数组 中 包含 元 素 0。( 换 句 话说， 最 后 一 个 元 素 的 索引 值 要 比 其 实际 包含 的 元 素 个 数 少 一 ， 译 者 注 )。 











急 这 种 糟糕 的 语法 来 源 于 C shell 。 庆 幸 的 是 ， 在 实际 的 代码 中 并 不 常见 。 











$end = $#rocks; #99, 最 后 一 个 元 素 的 索引 
$number of rocks = $end + 1;  # 正 确 ， 但 有 更 好 的 方法 
$rocks[$#rocks] = “hard rock ; ##he last Tock 









































由 于 经 常 将 $#name 的 值 作为 索引 ， 像 上 面 例子 那样 ， 因 此 ，Larry 提供 了 一 种 简便 方法 : 数组 的 负数 索引 值 从 最 后 一 个 元 



































素 开 始 。 但 不 要 认为 这 些 索引 是 循环 的 。 如 果 数 组 有 3 元 素 ， 那 有 效 的 负数 索引 值 是 -1 〈 最 后 一 个 元 素 )， -2 (中 间 的 元 素 )， 


-3《〈 第 一 个 元 素 )。 实 际 上 ， 几 乎 没有 人 使 用 除了 -1 之 外 的 其 它 的 负数 索引 值 。 



































$rocks[-1] = 'hard rock"; # 完 成 上 例 中 的 一 种 更 简单 的 方法 
$dead_rock = 'rocks[-100]; # 得 到 edrock', 第 0 个 元 素 
$rocks[-200] = “crystal”; # 亚 重 错误 (fatal error1) 


3. 3 列表 








数组 是 由 括号 括 起 来 并 且 其 元 素 由 去 号 分 隔 开 的 列表 。 这 些 值 组 成 了 数组 的 元 素 : 

















《125 32 必 舍 有 12 2，3 的 列表 
(1，2，3, ) # 同 上 ， 最 后 一 个 逗号 被 忽略 
(7 # 空 列表 -0 个 元 素 

(1 .. 100) # 包 含 100 个 整数 的 列表 











最 后 一 个 例子 使 用 了 范围 操作 符 (range operator).. ， 它 创建 了 从 左 值 到 右 值 之 间 所 有 值 的 列表 。 
































国有 全 本 江 同 1 2 .35 5 

人 # 同 上 一 最 小 值 和 最 大 值 被 转换 成 整数 
人 # 空 列表 一 .中 的 左 值 应 小 于 右 值 ， 和 否则 为 空 
(405 2 23 同 民 0 和 35 65 105 到 5 

($m .9$n) # 由 $m 和 $n 的 值 决定 

(0 .. $#rocks) # 上 节 中 有 $jocks 的 介绍 


从 上 面 最 后 两 个 例子 中 可 以 看 到 ， 列 表 中 的 元 素 并 非 必须 是 常数 ， 也 可 以 是 在 执行 此 语句 时 再 计算 值 的 表达 式 : 




















C$m，17) # 了 两 个 值 ，$m 的 当前 值 ， 和 17 
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(C$m+$o，$p+$q) # 了 两 个 值 


当然 ， 列 表 可 以 包含 任意 的 标量 值 ， 如 下 面 的 包含 字符 串 的 例子 : 





(CCfred7” barey” betty “willma “dino”) 
3. 3. 1gqw 简写 


实践 表明 ， 字 符 串 的 列表 《如 上 例 ) 在 Perl 中 经 常 使 用 。 有 一 种 简便 的 方法 可 以 不 用 输入 大 量 的 引号 而 达到 类 似 的 功能 ， 
那 融 是 使 用 qw。 
































dw(fred barney betty wilma dino ) “# 同 上 ， 但 输入 更 少 


qw 表示 “quoted words" 或 者 “quoted by whitespace” 这 依赖 于 你 问 的 是 谁 。 无 论 那 种 解释 ，Perl 将 它们 当 作 单 引号 字符 串 
处 理 ， 你 不 能 像 双 引号 那样 在 qw 中 使 用 m 和 $fred 。whitespace 〈 空 格 ， 像 Spaces,tabs,newlines 等 字符 串 ) 将 被 忽略 ， 剩 下 
的 组 成 了 列表 的 元 素 。 由 于 空格 被 忽略 ， 所 以 下 面 〈 不 常用 的 ) 是 另 一 种 书写 方法 : 


























qdw(fred 
barney betty 
wilma dino) # 同 上 ， 当 看 起 来 有 些 奇 怪 











日 于 qw 是 一 种 引用 ， 因 此 不 可 以 在 qw 内 汪 加 注释 。 









































『 面 两 个 例子 是 用 括号 作为 分 界 符 ， 但 Perl 允许 使 用 任何 标点 符号 作为 分 界 符 。 下 面 是 一 些 常 用 的 类 型 








zar 








qdw! fred barney betty wilma dino ! 
dw# fred barney betty wilma dino #， # 和 有些 像 注 释 
qdw( ， fred barney betty wilma dino) 





qw{t fred barney betty wilma dino } 
qw[ fred barmey betty wilma dino ] 
qw< fred barney betty wilma dino > 

















如 后 面 四 个 例子 中 显示 的 那样 ， 有 时 两 个 分 界 符 是 可 以 不 同 的 。 如 果 开 分 界 符 有 一 个 对 应 的 闭 分 界 符 ， 那 对 应 的 “ 右 ” 分 
界 符 则 为 其 闭 分 界 符 。 

















如 果 要 在 字符 串 中 使 用 半分 界 符 ， 很 可 能 选择 的 分 界 符 并 不 太 恰 当 。 如 果 不 想 或 者 不 能 改变 分 界 符 ， 那 可 以 使 用 反 斜 线 Q): 








dw!Yahooa\l Google excite lycos ! # 其 中 一 个 元 素 为 : 字符 串 yahool 


同 单 引号 字符 串 一 样 ， 两 个 反 斜 线 ， 可 以 得 到 一 个 反 冬 线 。 








正如 Perl 格言 中 所 说 :做 一 件 事 不 只 一 种 方法 (“There's More Than One Way To Do I), 你 可 能 猜想 为 什么 有 人 需要 这 些 不 
同 的 方法 。 在 后 面 你 将 看 到 许多 此 类 的 例子 ， 它 们 非常 有 用 。 如 我 们 处 理 Unix 中 的 文件 名 ， 
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qw{ 
/usr/dictwords 
/home/rootbeer.ispell_english 
} 
如 果 斜 线 J) 是 唯一 的 分 界 符 时 ， 那 么 上 述 例子 将 变 得 极其 繁琐 。 








3. 4 列表 赋值 
和 标量 值 类 似 ， 列 表 值 也 可 以 赋 给 变量 : 


($fred, $barney, $dino) = (flintstone ">“rubble” undef); 


< 




















左边 列表 中 的 每 一 个 变量 都 得 到 了 一 个 新 值 ， 和 利用 3 个 赋值 语句 得 到 的 结果 是 一 样 的。 由 于 列表 在 赋值 之 前 已 经 建 
因此 在 Perl 中 可 以 使 用 如 下 的 简单 方法 交换 两 个 变量 的 值 争 : 


》 























急 和 C 语言 不 同 ， 在 C 语言 中 没有 完成 此 类 操作 的 简单 方法 。C 程序 员 通常 需要 使 用 临时 变量 ， 可 能 是 使 用 宏 (macro) 来 定义 的 。 

















($fred, $barney) = ($barney, $fred) “# 灾 换 两 个 变量 
($betty[0],$betty[1]) = ($betty[1],$betty[0]); 




















如 果 变 量 个 数 〈 等 号 左边 ) 不 同 于 其 值 的 个 数 〈 等 号 右边 )， 将 发 生 什么 事情 呢 ? 在 列表 赋值 中 ， 额 外 的 值 会 被 自动 忽略 。 
因为 Perl 认为 ， 如 果 需 要 把 值 存 起 来 ， 那 应 当 指 明 其 存储 的 地 方 。 同 样 ， 如 果 有 多 余 的 变量 ， 额 外 的 变量 被 赋予 undef 售 。 





















































镶 对 于 标量 变量 这 是 对 的 。 对 于 数组 变量 将 得 到 空 的 列表 ， 在 后 面 将 看 到 。 




















($fred, $barney) = qdqw <flintstone rubble slate granite>; # 了 两 个 值 被 忽略 了 
($wilma,$dino) =  qw[flintstone]; #dino 为 undef 











现在 可 以 给 列表 赋值 了 ， 可 以 使 用 如 下 的 一 行 代 码 来 创建 按 一 个 字符 串 数组 争 : 














镶 我 们 假设 rocks 在 本 语句 之 前 是 空 的 。 如 果 之 前 的 $rocks[7] 非 空 。 那 ， 这 个 赋值 语句 将 不 会 改变 其 值 。 








(C$rocks[0],$rocks[1],$rocks[2],$rocks[3]) = qvw/talc mica feldspar quartz/; 


























当 想 引用 这 个 数组 时 ,Perl 有 一 种 简单 的 写法 。 在 数组 名 前 加 @( 后 没有 中 括号 ) 来 引用 整个 数组 。 你 可 以 把 他 读 作 “all of the 
(所 有 的 ) ”， 所 以 @rocks 可 以 读 作 “all of the rocks〈 所 有 的 石头 ) ” 争 。 其 在 赋值 运算 符 左 右 均 有 效 : 





急 Larry 声称 选择 美元 符号 (9) 和 @ 符 号 的 原因 是 ， 可 以 分 别 读 做 $calar(scalam 和 @arry(array)。 你 如 果 不 能 按 这 种 方式 来 记忆 ， 也 无 所 谓 。 








@rocks = qw /bedrock slate lava /; 


Qtiny = (); # 空 表 
@giant = 1..1e5; # 包 含 100，000 个 元 素 的 表 
Q@stuff = (@giant undef, @gianb); # 包 含 200，001 个 元 素 的 表 
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@dino = “granite”; 


@dquarry = (@rocks，“crushed rock” @tiny, $di 








nO); 


最 后 一 个 赋值 语句 将 五 个 元 素 (bedrock, slate, lava, crushed, rock granite ) 赋 给 变量 @quarry， 因 为 @tiny 没有 元 素 。( 特 别 的 





























是 ， 它 没有 undef 这 个 值 ， 但 可 以 像 @stuff 那样 明 胡 












































和 的 指定 它 。) 还 有 一 点 需要 注意 的 是 数组 名 字 被 其 列表 值 奉 换 。 数 组 不 


能 成 为 列表 的 一 个 元 素 的 原因 是 数组 只 能 包含 标量 值 ， 不 能 包含 其 它 的 数组 争 。 没 有 赋值 的 数组 变量 的 值 为 ( )， 空 表 。 和 





未 初始 化 的 标量 变量 为 undef 类 似 ， 未 被 初始 化 














急 但 在 Alpaca 书 中 ， 将 介绍 一 类 特殊 的 变量 : 引 ) 





























“ists of lists”( 列 表 的 列表 ) 的 数据 结构 ， 还 有 一 些 别 的 有 用 或 








者 有 趣 的 结构 。 即 便 是 那 种 情况 ， 也 不 是 将 一 个 列表 存放 在 一 个 列表 之 中 ， 











当 将 一 个 数组 揽 贝 到 另 一 个 数组 时 ， 仍 然 是 列表 赋值 。 如 下 例 : 


@copy = @quarry; # 将 一 个 数组 中 的 值 找 贝 的 另 一 个 数组 中 


3. 4. 1 pop 和 push 操作 

















事实 上 存放 的 是 其 引用 。 

















可 以 使 用 新 的 ， 更 大 的 索引 (index ) 将 新 值 存放 好 
我 们 将 介绍 几 种 不 使 用 索引 来 操作 数组 的 方法 。 





售 当 然 ， 我 们 是 在 开玩笑 ， 但 这 个 玩笑 基于 Penl 的 














E 数 组 的 末尾 。 但 实际 - 


一 些 事实 。 数 组 中 使 有 

















上 ，Perl 程序 员 不 使 用 索引 人 急 。 因 此 ,在 下 面 几 段 中 ， 














索引 并 没有 发 挥 Perl 的 威力 。 如 果 使 用 pop, push 和 类 似 的 操作 











符 以 避免 使 用 索引 , 那 你 的 程序 通常 会 比 大 量 使 用 索引 的 情况 要 快 , 而 且 能 避免 “ 差 一 位 (o 储 by-one)” 类 型 的 错误 , 这 类 错误 通常 叫做 “ 边 











界 值 错误 ”。 有 了 时， 一 个 初级 的 Per 程序 员 《〈 想 比较 Perl 和 C 的 速度 ) 将 针对 C 优化 过 的 排序 程序 《有 大 量 的 索引 操作 )， 用 Perl 来 直 
接 实 现 《从 而 有 大 量 的 索引 操作 )， 人 惊讶 于 它 为 什么 如 此 慢 。 答 案 是 ,“ 用 4 













































































\ 提 琴 来 订 钉 子 不 是 一 个 好 办 法 "。 


通常 将 数组 类 似 于 栈 来 使 用 ， 在 其 右边 添加 或 者 删除 数据 。( 这 是 数组 中 “最 后 ”一 个 元 素 ， 其 索引 最 大 )。 这 些 操作 经 常 








出 现 ， 因 此 提供 了 特殊 的 函数 。 
pop 操作 将 数组 的 最 后 一 个 元 素 取出 并 返回 


@array = 3..9; 














$fred = pop(@array); ” 冰 fred 得 到 9，@array 现在 为 5，6，7，8) 
$barney = pop @array; 示 barney gets 8, @array 现在 为 〈5,6,7) 


pop @array; #@array 现在 为 〈5 














，6) (7 被 丢弃 了 ) 











最 后 一 个 例子 中 ，pop 使 用 在 “im a void contexf"”， 也 就 是 说 没有 存放 其 返回 值 的 地 方 。 这 样 使 用 pop 是 合法 的 。 





如 果 数 组 为 空 ， 那 pop 什么 也 不 做 《因为 没有 元 素 可 以 移出 )， 并 返回 undef。 

















你 可 能 已 注意 到 pop 后 可 以 使 用 或 者 不 使 用 括号 。 这 在 Perl 中 是 一 条 通用 规则 : 如 果 去 掉 括 号 含义 不 变 ， 那 括号 就 是 可 选 
的 争 。 和 pop 相反 的 操作 是 push， 它 可 以 将 一 个 元 素 〈 或 者 一 列 元 素 ) 加 在 数组 的 末尾 : 
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镶 受 过 相应 教育 的 人 将 发 现 ， 这 是 同 义 反复 。 














push(@array,0); #@array 现在 为 (53,6,0) 

push @array,8; #@array 现在 为 (5，6，0，8 ) 

push @array,1. ，10; #@array 现在 多 了 10 个 元 素 

@others =dqw/9 0 2 1 0/; 

push @array,@others; #@array 现在 又 多 了 个 元 素 (共有 19 个 ) 


pusp 的 第 一 个 参数 或 者 pop 的 唯一 参数 必须 是 数组 变量 。 


3. 4. 2 shift 和 unshift 操作 











shift 对 一 个 数组 的 开头 进行 操作 〈 数 组 的 左 端 有 最 小 下 标的 元 素 )。 下 面 是 一 些 例子 : 


@array = dqw# dino fred barney 起 








$m = shift (@array); #$m 得 到 “dino”, @array 现在 为 (fred” “barney 
$n = shift @array; #$n 得 到 'fred”, @array 现在 为 〈“barmey”) 

shift @array; #@array 现在 为 空 

$o = shiftt @array; 的 o 得 到 undef @arry 仍 为 空 

unshift(@array,S); #@array 现在 为 〈5) 

unshift @array,4; #@array 现在 为 (4,5) 

@others = 1..3; 

unshift @array @others; #array 现在 为 〈1,2,3,4,5 ) 





和 pop 类 似 ， 如 果 其 数组 变量 为 空 ， 则 返回 undef。 


3. S$ 将 数组 插入 字符 串 


和 标量 类 似 ， 数 组 也 可 以 插入 双 引 号 的 字符 串 中 。 插 入 的 数组 元 素 会 自动 由 空格 争 分 开 : 

















人 分 隔 符 是 变量 $ "的 值 ， 其 默认 值 为 空格 (space)。 





@rocks = qw{ flintstone Slate rubble }; 
print“quartz @rocks limestonevn”” # 输 出 为 5 种 rocks 由 空格 分 开 









































Print “IThree rocks are: Q@rocks.m 
print “IThere's nothing in the parens (@empty) here.n”; 





如 果 蕊 了 数组 搬入 的 规则 ， 当 把 email 地 址 插入 双 引 号 字符 串 时 可 能 出 现 意 想 不 到 的 结果 。 日 
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插入 的 数组 元 素 的 第 一 个 元 素 前 面 和 最 后 一 个 元 素 后 面 不 会 插入 空格 ， 如 果 需 要 可 以 自己 加 入 : 


日 于 历史 原因 





push 和 pop 对 数组 的 末尾 进行 操作 《或 者 说 数组 右边 有 最 大 下 标的 元 素 ， 这 依赖 于 你 是 怎样 思考 的 )。 相 应 的 ，unshift 和 





人 ， 这 将 引起 编 
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译 时 的 严重 错误 : 























合 你 可 能 会 问 : 在 Perl5 之 前 ，Perl 将 不 会 蔡 换 没 有 定义 过 的 数组 标量 。 因 此 , “fed@bedrock.edu” 将 表示 email 地 址 。 但 当 某 人 加 入 了 一 
个 变量 @bedrock; 则 这 字符 串 将 变 成 “fred.edu” 或 者 更 粳 。 











$email = “fred@bedrock.edu”， # 错 误 ! 将 会 替换 @bedrock 
$email = “fredA@bedrock.edu”， # 正 确 
$email = 'fred@bedrock.edu”; # 另 一 种 方法 




















因此 ， 在 即将 发 行 的 Perl5〈 现 在 快 发 行 Perl6 了 : 译 者 注 )， 没 有 定义 的 数组 变量 的 行为 和 没有 定义 的 标量 变量 行为 一 致 ， 


也 就 是 说 ， 当 警告 打开 时 ， 没 有 初始 化 的 数组 变量 将 引起 警告 。 这 是 Perl 开发 者 10 年 来 经 历 的 错误 的 结果 。 




















只 有 一 个 元 素 的 数组 的 被 其 值 蔡 换 的 行为 和 你 预期 的 类 似 : 





Q@fred = qw(hello dolly); 


三 
$x =“This is $fred[1]'s place”; # “This is dolly's place” 
$x =“This is $fred[$y-1]s place”; # 同 上 























索引 表达 式 被 当 作 普 通 表达 式 求 值 ,看 起 来 和 不 在 字符 串 中 是 一 样 的 。 其 变量 不 会 首先 被 赋值 的 。 换 名 话说 , 如 果 $y 为 “2 细 4? 
那 上 述 表 达 式 的 值 为 1， 而 非 7， 因 为 “2*" 首 先 当 作 数 字 时 〈$y 在 数字 表达 式 中 ) 为 2 争 。 如 果 想 在 一 个 标量 变量 后 接 一 
个 左 中 括号 符 ， 那 应 当 在 其 间 加 入 分 隔 符 ， 否 则 会 被 作为 数组 看 待 : 


























然 ， 当 把 警告 打开 时 ，Penl 会 提醒 你 “2*4” 是 一 个 funny-looking 数字 。 
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| 





@fred = qw(eating Tocks is wrong); 
































$fred = “right'; # 我 们 将 打印 “this is right[3]?” 
print “this is $fred[3Jn7”” # 打 印 出 “wrong” 使 用 $fred[3] 
print“this is ${ffredj[3]m” # 打 印 出 “right”(〈 由 花 括 号 分 开 ) 
print“this is $fred”.“[3]\n”; # 正 确 〈 两 个 字符 串 ， 右 . 分 开 ) 
print “this is $fred\[3]\n”; # 正 确 ( 利 用 反 和 斜 线 转 义 ) 


3. 6 foreach 控制 结构 


如 果 能 处 理 整 个 数组 或 列表 ， 那 将 是 非常 方便 的 ， 因 此 Perl 提供 了 这 种 方法 。foreach 从 列表 的 第 一 个 元 素 一 直 循 环 执行 到 
最 后 一 个 元 素 ， 一 次 迭代 一 个 : 











foreach $rock (qw/ bedrock slate lava /){ 
print “One rocKk is $rock.\mn”; # 打 印 出 3 种 rocks 


} 





控制 变量 〈 本 例 中 为 grock) 每 一 次 迭代 从 列表 中 取出 一 个 新 值 。 第 一 次 为 “bedrocke", 第 三 次 为 qlavar。 


好 枉 | 





匡 
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控制 变量 不 是 这 些 列表 元 素 中 的 一 个 拷贝 而 是 这 些 元 素 本 身 。 也 就 是 说 ， 如 果 在 循环 中 修改 这 个 变量 ， 那 原始 列表 中 的 元 
素 也 会 被 修改 ， 如 下 面 代码 段 押 显示 。 这 条 性 质 是 有 用 的 ， 但 是 ， 如 果 不 清楚 ， 可 能 对 其 结果 感到 吃惊 。 


苹 




















@rocks = qw/ bedrock  Slate lava /; 
foreach $rocks(@rocks){ 





$rock =“\t$rocle” #@rocks 的 每 一 个 元 素 前 加 入 一 个 tab 
$rock . = \n>; # 每 一 个 元 素 后 加 一 个 换行 符 
} 
print“The rocks arexm”,@rocks; # 每 一 个 元 素 都 被 缩 进 了， 并且 一 个 元 素 占 一 行 





当 循 环 结束 时 $rock 的 值 为 多 少 呢 ? 其 值 同 循环 开始 之 前 相同 。foreach 循环 中 控制 变量 的 值 会 被 Perl 自动 保存 和 恢复 。 当 
循环 进行 时 ， 是 没有 办 法 改变 其 值 的 。 循 环 结束 时 ， 变 量 的 值 会 回 到 循环 开始 前 ， 如 果 没 有 值 则 为 undef。 这 意味 着 如 果 有 
一 个 变量 和 控制 变量 有 相同 的 名 字 : '$rock”， 不 用 担心 会 混淆 它们 。 





















































3. 6. 1 Perl 最 常用 的 默认 变量 : $ 


类 似 ， 如 





那 Perl 会 使 用 其 默认 的 变量 : $_。 除 了 其 不 寻常 的 名 字 外 ,这 和 普通 变量 





如 果 在 foreach 循环 中 省 略 了 控制 变量 ， 
下 看 代码 所 示 : 

















foreach(1..10){ # 使 用 默认 的 变量 $_ 
Print “TIcan count to $_!m” 
} 


























然 它 不 是 Perl 中 唯一 的 默认 变量 ， 但 无 疑 是 使 用 的 最 普遍 的 。 你 将 在 许多 例子 中 看 到 Perl 在 没有 要 求 它 使 用 某 个 变量 或 
值 时 ， 会 自动 使 用 变量 $ _， ， ee 个 变量 。 为 了 消除 你 的 疑虑 ， 下 面 的 print， 就 是 使 












































$_=“Yabba dabba doovn 7” 
print; 桂 [ 印 出 默认 变量 $_。 


3. 6. 2 reverse 操作 








ieverse 〈 道 转 ) 操作 将 输入 的 一 串 列表 〈 可 能 是 数组 ) 按 相 反 的 顺序 返回 。 如 果 不 喜欢 范围 操作 符 : ..， 只 能 从 小 到 大 ， 
那 可 以 使 用 reverse 来 解决 这 个 问题 














Q@fred =6 .10; 

@barney = Ieverse (@fred); 丰 时 到 10，9，8，7，6 
@wilma = reverse 6 .. 10; # 同 上 ， 没 有 使 用 额外 的 数组 
@fred = reverse @fred; # 将 逆转 过 的 字符 串 存 回去 














注意 最 后 一 行 ， 其 中 @fred 使 用 了 2 次 。Perl 通常 先 计 算 变量 的 值 《赋值 号 右边 )， 再 进行 赋值 。 
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注意 reverse 返回 逆转 的 列表 ， 它 不 会 改变 


Teverse @fred; 
Q@fred = reverse @fred; 


3. 6. 3 sort 操作 


sort 操作 将 输入 的 一 冲 列 表 〈 可 能 是 数组 ) 
序 。 当 然 ，ASCII 中 有 一 些 奇怪 的 地 方 ， 勾 








其 参数 的 值 。 如 果 返 回 值 没 有 赋值 给 某 个 变量 ， 那 这 个 操作 是 没有 什么 意义 的 : 








# 错 误 ， 没 有 改变 @fred 的 值 





# 改 变 了 @fred 的 值 
根据 内 部 的 字符 顺序 进行 排序 。 如 对 于 ASCII 字符 串 ， 将 根据 ASCII 序 进行 排 
大写 字母 在 小 写字 符 的 前 面 ， 数 字 在 字符 的 前 面 ， 而 标点 符号 散布 在 各 处 。 但 






































按 ASCII 排序 只 是 其 默认 的 行为 ， 在 第 十 三 章 中 ， 可 以 看 到 如 何 按 你 想 要 的 顺序 进行 排序 的 方法 : 
@rocks =qw/bedrock slate rubble granite /; 
@sorted = Sort(@rocks); # 得 到 bedrock, granite, rubble, slate 


@back = reverse SOrt @rocks; 
@rocks = Sort @Trocks; 


@numbers = Sort 97 .. 102; 


# 为 Slate 到 bedrock 
# 将 摸 序 的 值 写 回 @rocks 
# 得 到 100，101，102，97，98，99 











从 最 后 一 个 例子 可 以 看 到 ， 如 果 将 数字 按照 字符 串 进行 排序 可 能 得 到 没有 意义 的 结果 。 当 然 ， 默 认 的 排序 规则 下 ， 任 何 由 
1 开头 的 字符 串 先 于 由 9 开头 的 字符 串 。 和 reverse 一 样 ， 其 参数 是 不 会 受到 影响 的 。 如 果 想 将 茶 个 数组 排序 ， 那 必须 将 排 
序 之 后 的 结果 存 回 数组 中 : 






































# 错 误 ， 不 会 修改 @rocks 
# 现 在 @rocks 值 是 经 过 排序 的 


SoOrt @Trocks; 
@rocks = Sort @Trocks; 





3. 7 标量 和 列表 上 下 文 














本 节 是 本 章 中 最 重要 的 章节 。 事 实 上 ， 是 整 本 书 的 最 重要 一 他。 可 以 毫 不 夸张 地 说 ， 你 的 整个 Perl 职业 生涯 都 是 建立 在 对 
本 节 的 理解 之 上 。 如 果 之 前 的 章节 你 都 未 认真 阅读 ， 那 本 章 千 万 不 能 马虎 。 





























但 这 并 非 说 本 节 难 于 理解 。 本 节 仅 是 一 个 简单 的 概念 : 一 个 给 定 的 表达 式 在 不 同 的 上 下 文中 其 含义 是 不 同 的 。 这 本 身 没 什 
么 新 奇 的 地 方 ; 事实 上 这 在 自然 语言 中 是 司空 见怪 的 。 例 如 ， 在 英语 中 争 ， 假 设 某 人 问 你 “ead" 银 的 含义 。 它 的 具体 含义 
确切 的 含义 。 


和 你 怎样 使 用 它 有 关 。 除 非 你 知道 它 使 用 的 上 下 文 环 境 ， 和 否则 不 知道 其 
































人 


租 已 





















































类 





急 如 果 英 语 不 是 你 的 母语 ， 那 这 个 类 比 可 能 对 你 不 太 明 显 。 但 上 下 文 相关 在 
似 的 例子 。 





都 存在 ， 








此 可 以 在 你 自己 的 母语 中 找到 这 样 





插 何 语言 




















太 




















镶 抑 或 它们 问 的 是 “red" 的 含义 ， 如 果 他 们 是 嘴 上 说 的 。 无 论 哪 种 情况 ， 
言 可 以 把 每 一 种 思想 都 明白 无 误 的 表达 出 来 ， 特 别 是 本 名 话 。 


大 含义 都 是 不 确定 的 。 如 Donglas Hofstadter 所 言 ， 没 有 一 种 语 















































上 下 文 是 指 表 达 式 存在 的 地 方 。 当 Penl 解析 表达 式 时 ， 它 通常 期 望 一 个 标量 值 或 者 列表 值 争 。 这 既 称 为 表达 式 的 上 下 文 环 
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环境 人 。 























镶 当 然 ， 也 可 能 是 别 的 类 型 。 还 有 些 别 的 contexts 没有 在 此 处 给 出 。 没 有 人 知道 Perl 中 使 用 了 多 少 种 contexts; Perl 社区 中 的 首脑 人 物 在 
这 个 问题 上 也 没 一 致 答案 。 






























































银 这 和 人 类 语言 中 使 用 的 情况 类 似 。 如 果 犯 了 语法 错误 ， 那 很 快 会 被 发 现 ， 因 为 你 知道 在 特定 的 地 方 使 用 特定 的 词 。 最 终 ， 你 将 用 这 种 方 
法 来 阅读 Pen， 但 首先 应 该 以 这 种 方式 来 思考 。 



































42 + Something #something 必须 是 标量 
Sort _ Something #something 必须 是 列表 




















如 果 something 是 相同 的 字符 串 ， 在 一 种 情况 下 ， 它 返回 一 个 变量 值 ， 在 另 一 种 情况 下 ， 它 可 能 返回 列表 人 争 。Perl 中 的 表达 
式 将 根据 其 context 返回 适当 的 值 。 例 如 ， 一 个 数组 的 “name 急 ”， 在 列表 context 中 ， 它 返回 列表 元 素 ， 在 标量 context 中 ， 
它 返 回 数组 元 素 的 个 数 : 












































镶 当 然 这 个 列表 可 能 只 包含 一 个 元 素 。 也 可 能 为 空 ， 或 者 包含 任意 数量 的 元 素 。 








急 数 组 @people 的 真实 名 字 是 people。@ 只 是 一 个 限定 词 (qualifien。 


@people =dw(fred barney betty ); 
@sorted = Sort @people; # 列 表 context: barney , betty, fred 
$number = 42 + @people; # 标 量 context: 42+3， 人 得 到 45 





甚至 普通 的 赋值 〈 赋 给 标量 或 者 列表 ) 也 产生 不 同 的 contexts: 


























@list = @people; 要 个 People 的 列表 
$n = @people ; # 数 字 3 











不 要 得 到 这 样 的 结果 : 在 标量 context 中 能 返回 元 素 的 个 数 ， 在 列表 context 中 就 一 定 返 回 这 些 元 素 。 许 多 lisFproducing 的 
表达 式 争 将 返回 一 些 更 有 趣 的 结果 。 

















镶 对 于 本 节 ，“dist-producing" 表 达 式 和 “scalarproducing” 是 没有 多 少 区 别 的 。 任 何 表达 式 都 可 以 产生 标量 或 者 列表 ， 这 依赖 其 context 。 
此 ， 当 我 们 说 “1ist-producing expressings", 我 们 是 指 那些 通常 在 列表 context 中 使 用 的 表达 式 ， 当 其 在 标量 环境 中 使 用 时 可 能 产生 意 想 
到 的 结果 《〈 如 reverse 或 者 @fred )。 
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习 村 






































3. 7. 1 在 标量 Context 中 使 用 ListProducing 表达 式 





有 许多 表达 式 通常 都 是 产生 列表 的 。 当 其 在 标量 context 中 使 用 时 ， 会 得 到 什么 结果 呢 ? 让 我 们 看 看 这 个 操作 的 创始 人 怎么 
解释 的 。 通 常 ， 这 个 人 是 Larry， 其 文档 展现 了 整个 历史 。 对 于 Perl 的 学 习 ， 大 部 分 是 学 习 Larry 是 怎么 的 想 的 争 。 因 此 ， 
一 旦 你 能 像 Larry 那样 思考 时 ， 你 就 能 明白 Perl 的 行为 。 当 学 习 时 ， 你 可 能 需要 查看 其 文档 。 









































镶 更 准确 的 说 ，Larry 创建 Perl 时 ， 是 按照 你 希望 它 怎样 操作 来 设计 的 。 
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一 些 表达 式 根 本 没有 标量 context 的 值 。 例 如 ，sort 在 标量 context 
此 ， 除 非 有 人 按 另 一 种 方式 实现 了 sort， 否 则 其 在 标量 context 








另 一 个 例子 是 reverse 。 在 列表 context 中 ， 它 返 


成 一 个 字符 串 ): 
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@backwards = reverse qw /yabba dabba doo /; 


# 返 回 doo, dabba, yabba 


$backwards = Teverse qw/ yabba dabba doo /; 





# 返 回 oodabbadabbay 








下 面 是 一 些 例子 : 


$fred = something; 
@pebbles = Something; 
($wilma,$betty) = Something; 


($dino) = Something; 











开始 时 ， 你 可 能 对 于 表达 式 是 在 标量 或 者 列表 context 中 使 用 不 太 清 楚 。 但 ， 你 将 很 快 习惯 它 。 


# 标量 context 
# 列 表 context 
# 列 表 context 
# 列 表 context 


返回 什么 ?” 你 不 需要 要 排序 一 个 列表 来 得 到 其 个 数 ， 
P 返 回 undef。 





回 反 转 的 列表 。 在 标量 context 中 ， 返 回 反 转 的 字符 虽 


(或 者 将 反 转 的 结果 串 


不 要 被 具有 一 个 元 素 的 列表 所 欺骗 ， 最 后 一 个 是 列表 context 而 非 标量 context。 括 号 是 必须 的 ， 它 使 第 四 个 区 别 于 第 一 个 。 





如 果 将 其 赋 给 列表 〈 和 元 素 个 数 无 关 )， 则 为 列表 context。 如 果 赋 给 数组 ， 也 是 列表 context。 


让 我 们 看 看 已 经 出 现 过 的 一 些 别 的 表达 式 及 其 context。 下 面 是 一 些 标量 context: 





$fred = something; 
$fred[3] = something; 
123 + Something; 
Something + 654 
iti(Something){ .… } 


$fred[something] = Something; 


下 面 是 一 些 列表 context: 


Q@fred = Something; 

($fredq, $barney) = something; 
($fred) = something; 

push @fred, something; 
foreach $fred(something) 

SoOrt SoOmething 

TeVverse SOmething 


Print Something 
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3. 7. 2 在 列表 Context 中 使 用 Scalar-Producing 表达 式 














其 用 法 是 显然 的 : 如 果 一 个 表达 式 不 是 列表 值 ， 则 标量 值 上 自动 转换 为 一 个 元 素 的 列表 : 





Q@fred = 0#*7; 


Q@barney = “hello” “world ; 





下 面 是 另 一 个 例子 : 











@wilma = undef， #OOPS 1! 得 到 一 个 元 素 的 列表 (undeP ， 不 同 于 下 面 的 例子 
@betty = 0; # 将 数组 置 空 的 正确 方法 





























于 undef 是 一 个 标量 值 ， 将 undef 赋 给 数组 不 会 清空 数组 。 一 个 更 好 的 方法 是 将 空 列表 赋 给 它 争 。 























镶 在 现实 中 ， 如 果 变 量 被 合适 的 定义 在 恰当 的 作用 域 Gcope) 中 ， 则 不 需要 明确 的 将 其 清 室 。 这 种 赋值 语句 在 优秀 的 Pen 程序 中 很 少 出 现 。 
在 下 一 章 将 学 习作 用 域 。 








3. 7. 3 强制 转换 为 标量 Context 


























偶尔 ， 你 可 能 需要 标量 context 而 Perl 期 望 的 是 列表 。 这 种 情况 下 ， 可 以 使 用 函数 scalar。 它 不 是 一 个 真实 的 函数 因为 其 仅 
是 告诉 Perl 提供 一 个 标量 context: 








@rocks = qw(talc quartz jade obsidian); 


print “How many rocks do you haveyn ; 




















print “Ihave” @rocks，“TocksI\m”; # 错 误 ， 输 出 rocks 的 名 字 
print “Ihave ”, Scalar @Irocks，Tocksl\n ; # 正 确 ， 输 出 其 数字 


奇怪 的 是 ， 没 有 对 应 的 函数 能 强制 转换 为 列表 context。 但 请 相信 我 们 ， 事 实 上 你 并 不 需要 它 。 


3. 8<STDIN> 在 列表 Context 中 














前 面 学 习 过 行 输入 操作 : <STDIN>, 在 不 同 的 上 下 文 环境 中 返回 不 同 的 值 。 像 早先 描述 的 那样 <STDIN> 在 标量 context 中 返 
回 和 输入 的 下 一 行 。 在 列表 context 中 , 它 将 返回 这 个 输入 文件 的 所 有 剩余 部 分 。 而 每 一 行将 作为 一 个 独立 的 元 素 , 如 下 所 示 : 





















































@lines = <STDIN>; 林 千 输入 读 入 列表 context 中 























当 输 入 来 源 于 一 个 文件 时 , 它 将 读 入 文件 的 剩余 部 分 。 但 如 果 输 入 来 源 于 键盘 , 那 文 件 结束 符 (end-of-file) 是 怎样 输入 的 呢 ? 
在 Unix 或 者 类 似 的 系统 中 ， 包 括 linux, Mac OS X,， 通 常 可 以 输入 CTRL +D 来 表明 输入 已 经 结束 。Perl 会 忽略 这 个 字符 ， 
因此 它 将 在 屏幕 上 显示 出 来 。 在 DOS/WINDOWS 系统 中 ， 使 用 CTRL +Z 争 。 如 果 你 的 实际 情况 和 上 述 不 同 ， 查 看 你 系统 
的 文档 或 者 询问 你 附近 的 专家 。 
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急 这 仅仅 是 默认 值 ， 可 以 使 用 stty 来 改变 它 。 但 通常 是 使 用 它 ; 我们 还 没有 看 见 某 台 Unix 系统 不 是 使 用 CTRL+D 来 表明 end-of-file 的 。 






































急 在 Perl 的 某 些 DOS/WINDOWS 版 本 中 可 能 存在 bug， 在 第 一 行 中 使 入 CTRL+Z 可 能 存在 问题 。 在 这 样 的 系统 中 ， 可 以 使 用 在 输入 的 结 
束 处 加 上 %An 来 解决 。 





























如 果 某 人 运行 一 个 程序 ， 输 入 了 三 行 ， 并 且 使 用 了 恰当 的 end-of-file， 那 其 数组 将 含有 3 个 元 素 。 每 一 个 元 素 为 一 个 由 换行 
符 结束 的 字符 串 ， 对 应 于 由 3 个 换行 符 结束 的 输入 。 























如 果 在 输入 时 , 能 一 次 去 掉 (Cchomp) 所 有 的 换行 符 ， 沁 不 是 很 好 ? 如 果 将 chomp 应 用 于 一 个 包含 字符 串 的 数组 中 ， 他 将 把 这 
个 数组 中 每 一 个 元 素 的 换行 符 去 掉 ， 如 下 例 所 示 ; 








Q@lines = <STDIN>; # 卖 入 所 有 的 行 
chomp = (@lines); # 去 掉 所 有 的 换行 符 




















但 更 常见 的 做 法 是 : 





chomp (@lines = <STDIN>); # 恋 入 所 有 的 行 ， 不 包括 换行 符 


外 


当 写 你 自己 的 程序 时 ， 可 以 采用 任意 种 方法 ， 大 多 数 Perl 程序 员 使 用 第 二 种 ， 更 加 紧 凌 些 。 




















蕉 


尔 可 能 已 经 意识 到 这 些 输入 一 旦 读 过 ， 就 不 能 重新 读 了 争 。 到 了 文件 的 结尾 ， 就 没有 更 多 的 数据 可 以 读 入 。 























急 如 果 是 从 某 个 源 (source， 如 文件 ， 译 者 注 ) 输入 , 那 你 可 以 返回 去 重新 读 一 次 。 但 这 不 是 这 里 讨论 的 问题 。 














当 输 入 的 文件 为 一 个 400MB 的 log 文件 时 ， 将 发 生 怎样 的 情况 ? 行 输入 操作 符 读 入 所 有 的 行 ， 这 将 占 去 大 量 的 内 存 争 。Perl 
不 会 限制 你 那样 做 ， 但 你 系统 的 用 户 “ 更 别提 系统 管理 员 ) 将 很 可 能 阻止 你 。 当 输入 的 内 容 特别 大 时 ， 应 当 避 免 一 次 将 所 
有 的 内 容 都 读 入 内 存 。 









































急 一 役 ， 实 际 占 去 的 内 存 要 比 文件 要 大 。 也 就 是 说 ， 一 个 400MB 的 文件 读 入 数组 时 将 至 少 占 去 16 的 内 存 空 间 。 这 是 因为 Perl 为 了 节约 时 
间 而 浪费 了 些 内 存 。 这 是 一 个 好 的 交易 。 如 果 内 存 不 够 ， 可 以 去 买 一 些 ， 但 时 间 不 够 ， 那 就 很 难 办 了 。 





3. 9 练习 











1. [6] 写 一 个 程序 ， 将 一 些 字 符 串 《不同 的 行 ) 读 入 一 个 列表 中 ， 逆 向 输出 它 。 如 果 是 从 键盘 输入 的 ， 那 在 Unix 系统 中 
应 当 使 用 CTRL+D 表明 end-of-file ， 在 Windows 系统 中 使 用 CTRL+Z. 

















2. [12] 写 一 个 程序 ， 读 入 一 串 数 字 【〈 一 个 数字 一 行 )， 将 和 这 些 数字 对 应 的 人 名 《下 面 列 出 的 ) 输出 来 。 “将 下 面 的 人 
名 列表 写 入 代码 中 )。 例 如 ， 当 输入 为 1，2，4 和 2， 则 输出 的 为 fed, betty, dino， 和 betty: 





fred betty barney dino Wilma pebbles bamm-bamm 











3 [8] 写 一 个 程序 ， 将 一 些 字 符 串 《在 不 同 的 行 中 ) 读 入 一 个 列表 中 。 然 后 按 ASCII 顺序 将 它们 输出 来 。 也 就 是 说 ， 当 输 
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入 的 字符 串 为 fred, barney wilma, betty， 则 输出 为 barney betty fred wilma。 分 别 在 一 行 或 不 同 的 行将 之 输出 。 
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第 四 章 子 程序 





























你 已 经 见 过 一 些 内 矢 的 函数 了 ， 如 chomp, reverse， 和 print。 但 ,如 其 它 某 些 语言 一 样 ，Perl 也 可 以 构造 子 程序 (subroutines)， 
它们 是 用 户 定义 的 争 。 这 可 以 让 我 们 在 程序 中 重复 使 用 某 段 代 码 争 。 子 程序 的 名 字 是 Perl 中 的 另 一 个 标识 符 ( 由 数字 , 字符 ， 
下 划 线 但 不 能 由 数字 开头 的 串 组 成 ， 有 时 由 可 选 的 符号 (如 开头 。 关 于 何 时 需要 ， 何 时 不 需要 人 的 规则 ， 在 本 章 的 结尾 处 将 
介绍 。 现 在 ， 如 果 人 允许 时 我 们 都 将 使 用 它 (&， 这 通常 是 一 种 安全 的 做 法 。 当 然 ， 在 禁止 使 用 时 我 们 会 提醒 你 。 















































































































































镶 在 Perl 中 ， 我 们 不 像 Pascal 程序 那样 严格 的 区 分 : 函数 (functionsj， 将 返回 值 ， 和 子 程序 (procedures)， 不 返回 值 。 子 程序 (subroutine) 总 
是 用 户 定义 的 ， 而 函数 (function) 可 能 不 是 。 也 就 是 说 ， 某 个 函数 可 能 是 子 程序 (subroutine) , 或 者 是 Perl 内 蕉 的 函数 (funcitions) 。 这 也 就 
是 我 们 把 本 章 叫 做 Subroutines 的 原因 : 因为 是 关于 你 自 定义 的 而 非 系统 内 典 的 函数 。 








































































































合 本 书 中 40% 的 代码 来 源 于 公开 的 商用 程序 ， 如 果 合 理 使 用 ，75% 的 代码 都 可 以 在 你 的 程序 得 到 





用 。 











子 程序 的 名 字 属 于 一 个 独立 的 名 字 空 间 ， 因 此 Perl 不 会 在 你 的 子 程序 为 &fred 同时 也 有 一 个 变量 为 $fred 的 情况 下 混 消 , 当 
然 通 常 是 没有 理由 这 样 命名 的 。 





4. 工 定义 一 个 子 程序 














要 定义 自己 的 子 程序 ， 使 用 关键 字 sub, 子 程序 的 名 字 【〈 无 & 这 个 符号 )， 组 成 子 程序 的 缩 进 的 代码 块 ( 花 插 号 中 )， 如 : 


























争 怡 当 的 说 ， 花 括号 也 属于 块 的 一 部 分 。Perl 不 需要 缩 进 块 中 的 代码 ， 但 维护 人 员 需 要 。 因 此 请 遵守 这 个 规则 。 





Sub marine { 
$n += 1 # 全 局 变量 qn 


print“Hello, sailor number $nin2” 





子 程序 〈 本 章 中 若 无 特 殊 说 明 , 子 程序 均 指 subroutine, 译 者 注 ) 的 定义 可 以 在 程序 的 任意 位 置 ， 但 具有 如 C 或 者 Pascal 背景 
的 程序 员 通 常 将 它们 放 在 程序 的 开头 。 某 些 其 它 的 程序 员 可 能 将 它们 放 在 结尾 ， 以 使 程序 的 主要 部 分 在 开头 出 现 。 不 需要 
在 定义 之 前 有 任何 声明 。 子 程序 的 定义 是 全 局 的 ; 没有 某 些 强大 的 技巧 ，Perl 中 没有 私有 子 程序 (private subroutines) 争 。 如 
果 两 个 子 程序 有 相同 的 名 字 ， 那 后 一 个 将 覆盖 前 一 个 争 。 这 被 看 作 是 一 种 不 好 的 编 成 习惯 ， 它 将 迷惑 你 的 维护 人 员 。 






























































争 如 果 想 使 用 特殊 的 技巧 ， 阅 读 Perl 的 关于 私有 变量 (private variables) 中 的 coderefs 文档 。 












































如 前 面 例子 那样 ， 可 以 在 子 程序 中 使 用 全 局 变量 。 事 实 上 ， 到 现在 为 止 所 出 现 的 所 有 变量 均 是 全 局 的 ;也 就 是 说 ， 它 们 在 
程序 的 任意 部 分 都 可 以 被 访问 。 这 让 纯粹 的 语言 学 家 感到 恐慌 ， 但 一 些 Perl 的 开发 者 却 大 量 使 用 它们 。 在 本 章 后 面 的 “ 子 
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程序 的 私有 变量 ”一 节 中 将 介绍 怎样 创建 私有 变量 。 
4.， 2 调用 子 程序 


可 以 使 用 子 程序 的 名 字 〈 带 有 人 贸 ) 来 调用 子 程序 争 : 



























































争 通 常 有 括号 ， 即 便 参 数 为 空 。 子 程序 将 继承 调用 者 的 @_ 的 值 ， 这 会 马上 讨论 。 因 此 不 要 在 这 里 停止 ， 否 则 程序 可 能 和 你 预期 的 行为 不 同 。 

















&marine; # 和 输出 Hello, sailor number 1! 
&marine; # 输 出 Hello, sailor number 2! 
&marine; # 输 出 Hello, sailor number 3! 
&marine，; # 输 出 Hello, sailor number 4! 











通常 ， 我 们 说 调用 (invocatiom) 是 指 调用 子 程序 (call the subroutine) 。 





4. 3 返回 值 


子 程序 可 以 被 某 个 表达 式 调用 ， 无 论 此 表达 式 的 值 是 否 被 利用 。 如 早 些 的 例子 &marine， 我 们 得 到 此 表达 式 的 值 ， 但 其 值 被 
扔 择 了 。 























许多 时 候 ， 当 调用 某 个 子 程序 时 ， 需 要 使 用 其 返回 值 。 这 意味 着 应 当 注 意 子 程序 返回 值 。 所 有 的 Perl 子 程序 都 会 返回 值 ， 
在 Perl 中 返回 值 和 不 返回 值 是 没有 区 别 的 。 当 然 ， 不 是 所 有 Perl 子 程序 返回 的 值 都 是 有 用 的 。 





















































由 于 所 有 的 被 调用 的 子 程序 都 要 返回 值 ， 因 此 使 用 特殊 的 返回 值 语 法 在 大 多 数 情 况 下 是 一 种 浪费 。 因 此 Larry 将 之 简化 了 。 
当 Perl 所 历 此 子 程序 时 ， 将 会 计算 每 一 步 的 值 。 此 子 程序 中 最 后 计算 的 值 将 被 返回 。 





















































例如 ， 下 面 的 子 程序 : 


Sub Sum_of fred_and_barneyf{ 


Print“Hey, you called the sum_of fred_and_barney SuroutineINn ; 
$fred + $barney; # 返 回 值 
} 





子 程序 中 最 后 一 个 被 计算 的 表达 式 为 $fred + $barmey， 因 此 $fred 和 $barney 的 和 将 被 返回 。 下 面 是 一 些 调用 代码 ; 





$fred = 3; 

$barney = 4; 

$wilma = $sum_of fred_and_barney; #wilma 得 到 7 
Print \$wilma is $wilman”; 

$betty = 3* &sum_of fred_and_barney; #$betty 得 到 21 


Print “An$betty is $betty\m”; 
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上 述 代码 将 得 到 下 面 的 输出 : 


Hey, you call the sum_of fred_and_barney Subroutinel 
$wilma is 7. 
Hey, you call the sum_of fred_and_barney Subroutinel 
$betty is 21. 


上 述 print 语句 是 用 于 调试 的 ， 从 它 可 以 看 到 子 程序 被 调用 了 。 当 程序 调试 好 后 ， 应 当 把 它们 去 掉 。 假 设 在 上 述 子 程序 中 加 
入 了 下 面 的 一 行 代码 ; 

















Sub Sum_of fred_and_barney{ 


print “Hey, you called the sum_of fred_and_barney Subroutineltn ; 


$fred + $barney; # 其 值 不 会 被 返回 
print“Hey, 工 m returning a value nowIn ;， 扣 opSs! 


} 











大 ,以 大 
succfessful (打印 成 功 ) ” 银 ; 但 这 不 是 你 想 要 的 返回 值 。 因 此 当 疝 子 程序 加 入 新 的 代码 时 要 小 心 些 ， 因 为 返回 值 为 最 后 一 
个 被 计算 的 表达 式 。 


在 上 述 例子 中 ， 最 后 一 个 被 计算 的 表达 式 不 是 $fred + $barney， 而 是 print 语句 。 其 返回 值 通常 为 1， 意 思 是 “print was 



























































急 当 print 成 功 时 返回 tue， 失 败 时 返回 false。 下 一 章 将 了 解 到 更 多 种 类 的 失败 。 








因此 ,第 二 个 子 程序 中 $fred + barney 的 值 去 哪里 了 呢 ? 由 于 没有 把 它 存放 在 任何 地 方 , Perl 将 它 丢弃 了 。 如 果 打 开 了 和 警告， 
Perl (注意 到 两 个 变量 相 加 但 其 值 未 被 使 用 ) 可 能 给 出 如 下 的 警告 信息 “a useless use of addition in a void context.” 术语 void 
context 是 说 其 值 未 被 存 于 变量 或 者 被 别 的 方式 使 用 。 






































“The last expression evaluated” 的 含义 是 指 最 后 一 个 被 求 值 的 表达 式 ， 而 非 程序 的 最 后 一 行 。 例 如 ， 下 面 的 子 程序 返回 $fred 
和 $barney 的 较 大 值 : 
































Sub larger_of fred_or_barney { 
这 ($fred > $barney){ 
$fred; 
jelse{ 
$barney; 


} 























最 后 一 个 被 求 值 的 表达 式 是 $fred 或 者 $barney， 因 此 其 中 的 某 个 变量 成 为 返回 值 。 在 代码 实际 运行 前 ， 不 知道 是 $fred 或 
$barney 的 值 将 被 返回 。 
































上 述 例子 没有 什么 价值 。 如 果 每 次 调用 子 程序 时 可 以 传递 不 同 的 参数 比 依靠 全 局 变量 要 好 许多 。 这 将 在 下 面 进行 介绍 。 
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4. 4 参数 (Arguments) 


如 果子 程序 larger_of fred_barney 不 是 必须 使 用 全 局 变量 $fred 和 $barney， 那 将 变 得 更 有 用 。 如 果 要 得 到 $wilma 和 $betty 中 
较 大 的 值 ， 现 在 必须 将 将 它们 的 值 拷 贝 到 $fred 和 $barney 中 ， 然 后 再 调用 large_of fred_or_barney。 如 果 不 希望 改 变 这 些 变 
量 的 值 ， 那 首先 必须 把 这 些 变量 拷贝 到 其 它 变 量 之 中 ， 如 $save_fred 和 $save_barney。 然 后 ， 当 子 程序 结束 时 ， 再 把 它们 拷 
贝 回 变量 $fred 和 $barney 。 



































幸运 的 是 ，Perl 子 程序 可 以 带 参数 。 将 参数 列表 传 给 子 程 序 中 的 方法 是 ， 在 程序 名 后 面 接 括 号 ， 括 号 内 存放 参数 列表 ， 如 : 





























$n = 儿 max(10,15); # 此 子 程序 有 2 个 参数 


此 参数 列表 被 传 到 子 程序 中 ;这 些 参数 可 以 被 子 程序 使 用 。 当 然 ， 这 些 参 存放 在 某 个 地 方 ， 在 Perl 中 ， 会 自动 将 此 参数 列 
表 “〈 此 参数 列表 的 另 一 个 名 字 ) 自动 存放 在 一 个 叫做 @_ 的 数组 中 。 子 程序 可 以 访问 次 数组 变量 来 确定 此 参数 的 个 数 以 及 
其 值 。 


















































这 也 就 是 说 此 子 程序 参数 的 第 一 个 值 存 放 在 $_[0] 中 ， 第 二 个 存放 在 $_[1]， 依 次 类 推 。 但 必须 强调 的 是 这 些 变量 和 $_ 这 个 
变量 没有 任何 关系 , 如 $dino[3]( 数 组 @dino 的 一 个 元 素 ) 和 $dino 的 关系 一 样 。 这 些 参数 必须 存放 在 某 个 数组 变量 中 , 而 Pedl 
存放 在 @_ 这 个 变量 中 。 




















现在 ， 可 以 写 子 程序 $gmax， 其 功能 类 似 于 &larger_of fred_or_barney， 但 不 是 使 用 $fred， 而 使 用 〈$_[0]);， 不 使 用 $barney， 
而 使 用 人 4_[H)。 因 此 可 以 如 下 这 些 写 代 码 : 





Sub max{ 
# 和 &larger_of fred_or_barney 比较 

HG@_[O0] >$_[){ 
$_[0]; 
}else{ 
$_[]]; 

} 

} 





























我 们 说 ， 你 可 以 这 样 做 。 但 使 用 这 些 下 标 有 些 难看 ， 并 且 难 于 阅读 ， 书 号 ， 检 查 ， 调 试 等 。 后 面 有 更 好 的 方法 。 




















这 个 子 程序 有 另 一 个 问题 。&max 这 个 名 字 很 简单 ， 但 当 调 用 的 参数 不 是 两 个 时 ， 此 程序 不 能 提示 出 了 错误 : 








$n = &max(10,15,27); #oops! 





额外 的 参数 被 忽略 了 ; 因为 此 子 程序 不 会 使 用 $_[2]，Perl 不 会 关心 是 否 有 多 余 的 变量 。 参 数 不 够 时 也 会 被 忽略 ， 当 传 入 的 
参数 个 数 不 够 时 ， 不 够 的 参数 会 得 到 undef 这 个 值 。 在 本 章 后 面 ， 将 会 有 更 好 的 方法 ， 它 可 以 在 参数 个 数 任意 的 情况 下 正 
党 工作 。 












































@_ 是 子 程序 的 一 个 私有 变量 争 ， 如果 有 一 个 全 局 变量 @_， 它 将 在 此 子 程序 调用 前 存储 起 来 ， 当 子 程序 调用 完成 后 ， 其 早 
期 的 值 会 被 重新 赋 还 给 @_ 银 。 这 意味 着 当 将 参数 传递 给 子 程序 时 不 用 担心 它 会 影响 此 程序 中 其 它 子 程序 的 @_ 这 个 变量 的 
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值 。 骨 套 的 子 程序 调用 时 ，@_ 的 值 和 上 述 类 似 。 甚 至 此 子 程序 递归 调用 时 ， 每 一 次 调用 将 得 到 新 的 @_， 因 此 子 程序 调用 
时 将 得 到 其 自身 的 参数 列表 。 













































































急 除 非 调用 的 子 程序 前 有 & 而 后 面 没有 括号 〈 或 者 没有 参数 )， 此 时 @_ 从 此 调用 者 的 上 下 文 (contexb 得 到 。 这 通常 不 是 个 好 主意 ， 但 有 时 很 
有 用 。 


















































争 你 可 能 意识 到 这 里 使 用 的 机 制 和 上 一 章 中 foreach 循环 是 一 样 的 。 在 每 种 情况 下 ， 变 量 值 被 Perl 自动 保存 和 














新 赋值 。 

















4. 5S 子 程序 中 的 私有 变量 


Perl 在 每 一 次 调用 时 提供 @_ 这 个 私有 变量 ， 那 它 可 以 给 我 们 提供 私有 变量 吗 ? 答案 是 ， 能 。 











默认 情况 下 ，Perl 中 所 有 变量 都 是 全 局 的 ， 也 就 是 说 ， 这 些 变量 可 以 在 程序 的 任意 部 分 使 用 。 你 也 可 以 任意 时 候 使 用 my 
创建 私有 变量 : 














Sub max { 
my($m,$n); # 新 的 ， 私 有 变量 
($m$n) = @_; # 赋 值 
if($m > $n) {$mj else{f$n]} 
} 




















这 些 变量 是 此 代码 块 中 的 私有 的 《或 者 局 部 的 ) 变量 ， 别 的 $m 和 y$n 不 会 影响 此 处 的 两 个 变量 。 而 且 ， 其 它 地 方 的 代码 不 
能 访问 或 者 修改 这 些 变量 争 。 你 可 以 将 此 子 程序 放 在 任意 地 方 而 不 用 担心 它们 会 和 程序 其 它 地 方 的 gm，$ 〈 如 果 有 ) 变量 
混淆 争 。 在 让 代码 块 内 部 ， 其 语句 没有 分 号 。Perl 允许 省 略 括号 中 最 后 一 条 语句 的 分 号 ， 在 实际 代码 中 ， 通 常 仅 当 此 代码 
块 仅 包 含 一 条 语句 时 才 省 略 此 分 号 。 






















































































银 高 级 的 程序 员 知 道 在 程序 外 部 可 以 通过 引用 而 非 变量 名 字 来 访问 私有 变量 。 














当然 ， 如 果 此 程序 中 还 有 一 个 叫做 $max 的 子 程序 , 那 将 引起 混淆 。 


























前 一 例 中 的 子 程序 可 以 变 得 更 简单 。 你 注意 到 列表 ($m,$n) 书 写 了 2 次 吗 ? my 操作 符 可 以 用 在 有 括号 的 变量 的 列表 中 ， 因 
此 ， 通 常 将 上 述 两 个 语句 如 下 书写 : 





























my($m,$n) =@ _; 





上 面 的 一 条 语句 创建 了 一 些 私 有 变量 并 给 它们 赋值 ， 第 一 个 为 $m， 第 二 个 为 Sn 。 几 乎 每 一 个 子 程序 都 由 类 似 的 语句 开头 。 
当 看 见 那 一 行 时 ， 你 就 知道 此 子 程序 需要 2 个 变量 ， 在 此 子 程序 中 非 别 被 叫做 $m 和 $n 。 









































4. 6 参数 列表 的 长 度 


在 实际 的 Perl 代码 中 ， 传 递 给 子 程序 的 参数 个 数 是 没有 限制 的 。 这 符合 Perl 的 设计 哲学 “没有 不 必要 的 限制 ”。 当然， 有 
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一 点 和 传统 的 程序 设计 语言 很 不 相同 ， 这 些 语 言 中 要 求 其 子 程序 中 参数 个 数 和 参数 类 型 是 严格 确定 的 。Perl 的 这 种 灵活 特 


性 很 好 ， 但 〈 你 将 在 &max 这 个 函数 中 看 到 ) 可 能 引起 问题 ， 如 使 用 了 错误 的 参数 个 数 来 调用 子 程序 。 


























当然 ， 子 程序 可 以 容易 的 检测 @_ 是 否 含有 恰当 的 个 数 。 例 如 ， 我 们 可 以 如 下 的 





所 写 &max 争 : 

















多 当 在 下 一 章 学 习 warn 后 ， 你 可 以 使 用 恰当 的 警告 信息 。 如 果 认 为 这 是 个 严重 的 问题 ， 也 可 以 使 用 die， 这 也 将 在 同一 章 中 有 介绍 。 




















Sub max{ 
if(Q@_!=2){ 


Print "WARNING! &max Should get exactly two argumentst\n ; 
} 


失 ontinue as before..….. 


} 











让 语句 检测 参数 个 数 是 否 恰当 《此 时 ， 数 组 是 在 标量 环境 中 使 用 的 ， 它 将 返回 其 个 数 )， 在 第 三 章 中 有 介绍 。 
































、 














量 在 实际 的 Perl 程序 中 ， 很 少 使 用 这 样 的 方法 ; 更 好 的 方法 是 子 程序 可 以 在 任意 参数 个 数 的 调用 者 中 正常 工作 。 


4. 6. 1 更 好 的 &max 程序 





现在 








写 &max， 使 它 可 以 在 任意 参数 个 数 下 都 能 正常 工作 ; 
$maximum = 多 max(3,5,10,4,6); 


Sub max { 
my($max_so_far) = shift @_; 
foreach (@_){ 
if($_>$max_so_far){ 
$max_so_far=$_; 
} 
} 
$max_so_far; 


} 














这 段 代 码 使 用 了 一 种 叫做 high-water mark 的 算法 : 洪水 之 后 , 会 在 岸 边 留 下 痕迹 。 最 高 处 的 标记 , 表明 了 到 达 的 最 高 水 位 。 
在 此 程序 中 ，$max_so_far 记录 最 高 的 水 位 。 第 一 行 中 置 $max_so_far 为 3( 第 一 个 参数 )， 它 是 从 参数 数组 : @_ 中 移出 来 的 。 
此 时 ，@_ 变 成 了 (5，10，4，6)， 因 为 3 已 被 移出 。 此 时 出 现 过 的 最 大 数 为 3。 


























现在 ，foreach 循环 遍历 @_ 剩 下 的 值 。 循 环 中 的 控制 变量 是 默认 变量 $_。( 请 记 住 ，$_ 和 @_ 没 有 任何 关系 ;它们 名 字 相 同 
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完全 是 巧合 )。 第 一 次 循环 时 ，$ 为 S。 计 测试 语句 中 发 现 它 比 $max_so_far 大 ， 因 此 $max_so_far 现在 变 成 了 S。 




















下 一 次 循环 中 ，$_ 为 10。 它 是 一 个 更 大 的 值 ， 此 时 $max_so_far 为 10。 











接着 ，$ 为 4。 现在 $ 小 于 $max_so_far: 10。 因 此 ， 放 中 的 语句 块 被 跳 过 。 








接着 ，$_ 为 6， 基于 同样 的 原因 ， 计 语句 块 被 跳 过 。 这 是 最 后 一 次 循环 。 





现在 ，$max_so_far 的 值 将 被 返回 。 他 为 最 大 值 : 


4. 6. 2 空 参 数列 表 




















经 过 改进 后 的 &max 有 了 很 大 的 提高 ， 其 参数 可 以 不 是 2 个。 但， 如果 参数 个 数 为 0， 会 发 生 什么 情况 呢 ? 









































初次 遇 到 这 个 问题 时 ， 可 能 认为 其 过 于 深奥 。 毕 竟 ， 谁 会 调用 &max 而 不 给 其 参数 呢 ? 但 是 ， 某 人 可 能 如 下 书写 : 








$maximum = 多 max(@numbers); 


而 @numbers 可 能 为 空 ， 例 如 可 能 从 空 文件 读 入 。 因 此 ， 你 需要 知道 ，&max 此 时 会 怎样 处 理 呢 ? 





子 程序 第 一 行将 @_ 的 第 一 个 元 素 赋 给 $max_so_far。 这 不 会 有 什么 坏 影响 ; 数组 为 空 ，shift 操作 返回 undef 给 $max_so_far。 




















现在 进入 foreach 循环 体 ， 由 于 为 空 ， 循 环 体 一 次 都 不 执行 。 








现在 ，Perl 返回 $max_so_far 的 值 undef。 在 某 种 意义 下 ， 这 是 正确 的 答案 ， 因 为 空 表 中 没有 最 大 的 元 素 。 























当然 ， 当 调用 此 子 程序 时 注意 返回 值 可 能 为 undef， 或 者 保证 调用 的 参数 非 空 。 











4 7my 变量 的 注 杰 








这 些 局 部 变量 可 以 在 任意 块 中 使 用 ， 不 仅仅 是 子 程序 中 。 例 如 ， 可 以 在 让 ，while，foreach 等 块 中 使 用 : 








foreach (1..10){ 
my($square) = $_*$_; # 本 循环 中 的 私有 变量 
print '$_ squared is $squrare.\n”; 


} 





变量 $square 是 私有 的 ， 仅 在 此 块 中 可 见 ; 在 本 例 中 ， 此 块 为 foreach 循环 块 。 如 果 没 有 大 括 符 〈{})， 它 将 是 整个 文件 中 的 
私有 变量 。 到 现在 为 目 ， 你 的 程序 不 会 超过 一 个 文件 ， 因 此 不 讨论 这 个 问题 。 只 有 和 它 处 于 “个 代 查 区 中 的 语 可 才能 便 用 
它 。 这 非常 有 利于 代码 的 维护 ， 如 果 $square 值 错 了 ， 则 其 被 限制 在 相应 的 代码 段 中 。 有 经 验 的 程序 员 《〈 通 常 是 通过 六 苦 的 
实践 ) 发 现 将 变量 的 作用 域 限 制 在 一 页 ， 或 者 几 行 代码 中 ， 能 加 速 开 发 和 测试 。 
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当然 ，my 操作 不 会 改变 赋值 参数 的 context: 





# 询 表 context， 同 ($sum) = @_; 
my $num= @_; # 标 量 context， 同 num= @ ; 


my ($num = @_; 





















































过 上 下 文 来 判断 其 context。 














记 住 ， 如 果 没 有 使 用 插 号 ，my 仅 定义 一 个 变量 争 : 











在 第 一 个 例子 中 , $num 得 到 第 一 个 参数 , 因为 其 在 列表 context 中 ; 第 二 个 例子 中 , 将 得 到 参数 的 个 数 , 因 
中 。 两 条 语句 都 可 能 是 正确 的 ; 不 能 仅 赁 它 来 判断 是 否 使 用 错误 ， 因 此 Perl 不 能 提示 〈warning ) 你 ， 如 果 你 使 有 
然 ， 不 能 将 这 两 天 语句 写 在 同一 个 子 程序 中 ， 因 为 不 能 在 一 个 作用 域内 重复 定义 某 个 变量 )。 当 读 到 这 样 的 代码 时 ， 可 以 通 














为 是 在 标量 context 
昌 错 误 。( 当 














人 通常， 将 warning 打开 会 报告 这 样 使 用 my， 或 者 你 自己 调用 1-800-LEXICAL-ABUSE 来 报告 。 使 用 strict pragma (将 在 后 面 提 及 )， 将 会 


























阻止 这 类 错误 的 发 生 。 





my $fred, $barney; “# 错 误 ! 没有 定义 $barney 
my ($fred, $barney); # 两 个 均 定 义 了 


当然 ， 可 以 使 用 my 创建 新 的 ， 私 有 数组 争 : 





急 或 者 hashes， 在 第 六 章 中 有 介绍 





my @phone_number'; 


























如 果 新 的 变量 没 被 赋值 的 话 : 标量 变量 会 自动 赋 与 undef， 而 数组 变量 会 赋 与 空 列 表 。 


4. 8 使 用 strict Pragma 








Perl 是 一 种 宽容 的 语言 争 。 你 可 能 希望 Perl 严格 一 些 ; 那 可 以 使 用 strict pragma。 


争 你 可 能 还 没 注 意 到 。 





pragma 可 以 提示 编译 器 ， 告 诉 它 一 些 关 于 这 块 代码 的 信息 。 如 ， 使 用 strict pragma 告诉 Perl 的 编译 器 ， 应 当 严格 的 检查 这 段 代 码 。 








为 什么 要 使 用 这 种 方法 呢 ? 假设 你 写 一 个 程序 ， 输 入 了 如 下 这 一 行 : 











$bamm_bamm = 3; #Perl 自动 创建 这 个 变量 








现在 ， 你 接着 输入 一 些 新 的 代码 。 当 上 面 一 条 语句 滚动 到 屏幕 以 外 时 ， 你 输入 了 下 














$bammbamm + =1; #Oops! 
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押 这 条 语句 : 
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由 于 Perl 把 它 当 作 一 个 新 的 变量 (下划线 是 有 含义 的 )， 它 将 创建 这 个 变量 ， 并 增 1。 如 果 你 足够 幸运 或 者 聪明 ， 打 开 了 和 警 
Pel 将 告诉 你 这 个 ， 或 者 这 两 个 变量 仅 使 用 了 一 次 。 如 果 你 没 那么 幸运 ， 每 个 变量 使 用 了 不 止 一 次 ， 那 Perl 
将 不 会 警告 你 。 





























告诉 Perl 进行 更 严格 的 语法 检测 ， 需 要 在 程序 顶端 use strict (或 者 在 任意 块 或 者 文件 中 ， 如 果 你 需要 在 此 部 分 使 用 它 ): 





use strict; # 人 迫使 采用 更 严格 的 检测 











现在 ， 除 了 其 它 限 制 外 争 ，Perl 将 要 求 你 在 申明 每 一 个 新 的 变量 时 ， 使 用 my 售 : 




















争 要 想 知道 更 多 的 限制 ， 可 以 查看 关于 strict 的 文档 。 文 档 是 按照 pragma 的 名 字 来 归档 的 。 因 此 ， 命 令 perldoc strict( 或 者 你 系统 中 查看 文 
档 的 命令 ) 将 为 你 找到 相应 的 文档 。 














| 


多 当然 ， 还 有 一 些 别 的 声明 变量 的 方法 。 








my $bamm_bamm=3 ; # 新 的 局 部 变量 





如 果 ， 你 把 它 拼写 成 别 的 形式 ，Penl 将 警告 你 ， 你 没有 定义 如 $bammbamm 的 变量 ， 因 此 这 类 错误 在 编译 时 既 能 发 现 。 


$bammbamm+=1; # 没 有 这 样 的 变量 ， 编 译 时 错误 











外 


然 , 这 只 是 针对 Penl 的 新 的 变量 ; 对 于 Per 内 医 的 变量 如 , $_，@_ 则 不 需要 申明 争 。 如 果 在 以 前 的 程序 中 使 用 use stricb 
at 得 到 许多 警告 信息 ， 因 此 你 应 当 养 成 使 用 strict 的 习惯 。 





























事实 上 ，use strict 不 会 阻止 这 两 








此 ， 遇 到 这 种 问题 时 ， 使 用 其 它 的 变量 名 。 








六 | 





























急 在 某 些 情况 下 ， 不 应 当 申明 $a, $b， 因 为 它们 被 or 使用。 
个 变量 ， 在 Perl 中 不 算 bugs。 























许多 人 推荐 如 果 程 序 长 度 大 于 一 个 屏幕 ， 则 需要 使 用 use strict。 我 们 赞成 这 种 观点 。 














从 现在 开始 ， 我 们 例子 中 的 大 多 数 程 序 〈 不 是 全 部 ) 将 使 用 use strict， 虽 然 有 时 我 们 没有 将 它 明显 的 写 出 。 因 此 ， 当 定义 
新 变量 时 ， 我 们 将 使 用 my。 虽然 ， 我 们 不 经 常 这 样 做 ， 但 是 我 们 推荐 你 在 你 的 程序 中 尽 可 能 的 使 用 use strict。 























4. 9 返回 操作 


加 操作 将 立刻 的 从 子 程序 中 返回 一 个 值 : 





























疝 


my @names = qw /fred barney betty dino Wilma pebbles bam-bammn/; 
my $result = 放 which_element_ is("dino”，@names); 


Sub which_element_is{ 
my($what, @array) = 
foreach(0..$#array){ #@array 元 素 的 索引 


if($waht eq $array[$_]){ 
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这 个 子 程序 是 寻找 @names 


return $_ ， 


} 
-1 ; 
} 
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# 找 到 既 返 回 





# 没 有 找到 元 素 〈 此 处 是 可 选 的 ) 








P “dino” 的 索引 值 。 首 先 ， 定 义 了 2 个 参数 : $what， 查 找 的 对 象 ，@array， 被 搜索 的 数组 。 本 


例 中 为 @names 的 一 份 拷贝 。foreach 循环 遍历 数组 @array【〈 第 一 个 索引 值 为 0， 最 后 一 个 为 $#array， 第 三 章 中 有 介绍 )。 


每 一 
返 


如 果 不 存 在 所 要 得 找 的 元 素 呢 ?7 在 本 例 中 ， 子 程序 返回 -1， 表 明 “ 值 不 存在 ”。 如 果 想 更 加 Perlish， 那 可 以 返回 undef， 但 





次 循环 时 ， 将 检测 数组 @array 当前 的 元 素 的 是 否 为 what 中 的 元 素 争 。 如 果 相 同 ， 则 返 











急 注 意 此 有 





时 














回 的 最 常用 方法 是 使 用 return 语句 ， 它 将 立刻 返回 ， 而 不 会 执行 其 余 的 代码 。 











的 比较 符 为 ， eq， 而 非 三 三 














本 例 中 ， 程 序 员 选择 了 -1。 上 例 中 使 用 return -1 也 是 正确 的 ， 但 return 是 多 余 的 。 




















某 些 程序 员 喜 欢 每 次 都 使 用 returm 语句 , 表明 其 为 返回 值 。 例 如 , 你 可 能 想 从 子 程序 中 立刻 返 
如 本 章 前 面 的 &larger_of _fred_or_barey 这 个 例子 。 这 并 非 是 必须 的 ， 但 也 没什么 坏 的 影响 。 对 大 多 数 Perl 程序 员 来 讲 ， 这 
仅 是 多 输入 七 个 字母 而 已 。 























4. 9. 1 省 略 符号 & 





下 


有 几 条 规则 确 
































相 了 解 到 )。 











回 此 时 的 索引 值 。 从 当前 代码 



































回 ( 非 最 后 一 行 ) 而 使 用 return， 





定 在 调用 子 程序 时 是 否 可 以 省 略 掉 匀 。 如 果 编 译 器 在 调用 之 前 知道 此 子 程序 的 定义 ， 或 者 Perl 从 语法 中 能 知 
道 这 是 一 个 子 程序 调用 ， 则 子 程序 前 的 符号 和 是 可 以 省 略 的 ， 像 使 用 内 和 嵌 (builtin) 函 数 一 样 〈 这 些 规则 后 有 一 个 特例 ， 将 在 























这 意味 着 如 果 Perl 能 通过 语法 就 能 判断 其 是 否 为 子 程序 调用 ， 那 将 非常 方便 。 例 如 ， 如 果 用 括号 将 一 些 参 数 括 起 来 ， 那 其 
为 函数 @ 调 用: 




















急 在 下 例 中 ， 其 调用 的 子 程序 为 &shufftle。 但 它 可 能 是 一 个 内 嵌 的 函数 。 











my @cards = shuffle(@deck_ of cards); # 信 是 不 必要 的 





如 果 Perl 内 部 的 编译 器 知道 此 子 程序 的 定义 ， 则 可 以 省 掉 其 参数 的 括号 ; 














Sub division{ 


$ [0] /$_[]; # 第 一 个 参数 除 以 第 二 个 参数 


} 


my  $quotient = division 35$, 113;  # 可 以 省 略 挤 括 号 


上 述 代码 能 正常 运 
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行 ， 因 为 如 果 加 上 括号 不 能 改变 其 那 括号 就 是 可 选 的 。 
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> 


旧 不 要 将 上 述 子 程序 的 声明 放 在 调用 函数 的 后 面 ， 否 则 编译 器 不 知道 调用 division 是 什么 意思 。 编 译 器 需 在 调用 前 知道 其 
定义 ， 那 样 就 可 以 将 它 当 作 内 藤 (builtin) 的 函数 看 待 了 。 












































上 述 并 非 其 特别 的 地 方 。 特 别 的 地 方 为 : 如 果子 程序 和 Perl 一 个 内 航程 序 同名 ， 则 必须 使 用 & 来 调用 它 。 编 译 器 将 在 调用 
之 前 检查 其 定义 ， 而 非 直接 将 它 当 作 内 抠 的 函数 来 处 理 。 加 上 &, 可 以 确保 你 调用 了 此 子 程序 ， 不 加 ， 则 仅 当 没有 同名 的 内 
嵌 函 数 时 才能 调用 到 它 : 












































Sub chomp { 
Print “Munch, MunchlNn ; 
} 
&chomp; # 此 处 的 区 是 必须 的 
































如 果 没 有 人 &， 我 们 将 调用 内 骨 的 函数 chomp， 虽 然 已 经 定义 了 子 程序 &chomp 。 因 此 ， 实 际 的 使 用 规则 是 : 除非 知道 Perl 所 
有 的 内 嵌 函 数 ， 和 否则 函数 调用 时 都 应 当 使 用 放 。 这 即 是 说 在 你 头 几 百 个 程序 都 应 当 使 用 你 。 但 如 果 你 看 到 某 人 的 代码 中 省 略 
掉 了 廊 ， 这 并 非 一 定 是 错误 ;可 能 他 们 知道 Perl 没有 具有 相同 名 字 的 内 骨 函 数 争 。 当 程序 员 打 算 调用 其 自己 的 子 程序 和 调 
用 内 藤 的 (builtin) 函数 一 样 时 ， 通 常 是 写 模 块 (modules)， 经 常 使 用 原形 〈prototypes) 来 告诉 Perl 预期 的 参数 类 型 。 创 
建 模块 是 一 种 高 级 技术 ; 当 你 准备 好 时 ,可 以 参看 Perl 的 关于 子 程序 原型 (subtoutine prototypes) 和 创建 模块 (naking modules) 
的 文档 〈 特 别 是 permod 和 perlsub 两 份 文 档 )。 
































[ 








急 当 然 ， 他 们 也 可 能 犯错 误 ; 你 可 以 搜索 perlfunc 和 perlop 的 用 户 子 
Perl 会 提示 你 这 种 问题 。 


册 来 查看 其 是 


芭 


为 某 个 内 媒 函 数 的 名 字 。 当 把 





] 蒋 


告 (warnings ) 打开 时 ， 





并 








4.， 10 非 标 量 返 回 值 








标量 并 非 子 程序 返回 的 唯一 类 型 。 如 果 你 在 列表 context 中 调用 某 个 子 程序 争 ， 则 其 会 返回 列表 值 。 



































急 你 可 以 使 用 wantarray 函数 来 判断 一 个 子 程序 是 在 标量 还 是 列表 context 中 使 用 的 ， 这 可 以 让 你 轻松 的 写 出 恰当 的 子 程序 。 





























假定 想得到 某 个 范围 内 的 数字 《〈 如 范围 操作 符 )， 从 小 到 大 ， 或 者 从 大 到 小 。 范 围 操 作 符 具 能 从 小 到 大 ， 但 可 以 很 容易 的 弥 
补 这 种 缺陷 : 


Sub list_from_fred_to_barney { 
这 $fred < $barney) { 
#Count upwards from $fred to $barney 
$fred ..， $banrey 
| aseif 
#Count downwards from $fred to $barney 
Teverse $barney . . $fred; 


} 
$fred = 11; 
$barney = 6; 


@c = &list_from_fred_to_barney;#Q@c 为 (11，10，9，8，7，6) 
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在 本 例 中 ， 范 围 操作 符 给 我 们 6 到 11 的 列表 ，reverse 倒转 此 列表 ， 因 此 得 到 从 11 到 6 的 列表 。 














也 可 以 什么 都 不 返回 。 如 果 return 后 没有 任何 参数 则 在 标量 context 中 将 返回 undef， 而 在 列表 context 中 将 返回 空 列 表 。 这 
有 助 于 检验 子 程序 是 否 返 回 了 正确 信息 ， 提 示 调 用 者 当前 不 能 返回 更 有 意义 的 值 。 

















4. 1L 练习 


附录 和 A 中 有 答案 : 
1. [12] 写 一 个 名 为 &total 的 子 程序 ， 返 回 一 列 数字 的 和 。 提 示 : 子 程序 不 应 当 有 任何 的 IO 操作 ; 它 处 理 调 用 的 参数 ， 返 
回 处 理 后 的 值 给 调用 者 。 结 合 下 面 的 程序 来 练习 ， 它 检测 此 子 程序 是 否 正常 工作 。 第 一 组 数组 之 和 我 25。 





















































my @fred=qw{13379)》; 

my $fred_total = total(@fred); 

Print "The total of \@fred is $fred_total.\n' '; 
Print "Enter Some numbers on Separate lines:“”; 
my $user_total = 多 total(<STDIN>); 


print "The total of those numbers is $user_total.\n ; 


2.， [5 利用 上 题 的 子 程序 ， 写 一 个 程序 计算 从 1 到 1000 的 数字 的 和 











3. [18] 额 外 的 练习 : 写 一 个 子 程序 ， 名 为 &above_average， 将 一 列 数字 作为 其 参数 ， 返 回 所 有 大 于 平均 值 的 数字 〈 提 示 : 
另外 写 一 个 子 程序 来 计算 平均 值 ， 总 和 除 以 数字 的 个 数 )。 利 用 下 面 的 程序 进行 测试 ; 








my @fred = 儿 above_average(1..10); 

print \C@fred is @fredm ; 

print "(Should be678910Nn "; 

my @barney = 儿 above_average(100, 1..10); 
print \@barney is @barneyNn ; 

Print "(Should be just 100)Nn ; 
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第 五 章 输入 与 输出 














我 们 在 早 
容 。 如 果 熟 悉 标 准 输入 ， 输 出， 错误 流 ， 将 更 有 利于 本 章 的 











期 练习 中 已 经 使 用 过 一 些 输入 /输出 (MO) 操 作 。 现在 我 们 将 学 习 更 多 的 此 类 操作 , 其 涵盖 了 大 概 80 多 的 输入 /输出 内 














学 习 。 如 果 不 熟 悉 ， 通 过 本 章 的 学 习 你 将 掌握 这 类 知识 。 现 在 ， 





想象 “标准 输入 〈standard input) ”为 “ 键 种 交 “ 标 准 输出 (standard outpuD” 为 “显示 器 ” 





5s. 工 从 标准 输入 设备 输入 





从 标准 输入 设备 输入 是 容易 的 。 使 用 <STDIN>， 我 们 已 经 见 过 


了 旬 。 在 标量 context 中 它 将 返回 和 输入 的 下 一 行 ; 











这里， 我 们 称 ; <STDIN> 为 行 输入 操作 ， 但 世 





件 句 柄 (filehandle)。 
$line = <STDIN>; # 读 入 下 一 行 ; 
chomp($line); # 去 掉 结 尾 的 换行 符 


chomp($line=<STDIN>) # 同 上 ， 更 常用 的 方 

















while (defined($line = <STDIN>)) { 


print “Isaw $line”; 





第 一 行 代 码 值得 仔细 说 明 : 我 们 将 输入 的 字符 串 读 入 一 个 变量 ， 检 查 
此 ， 在 循环 的 内 部 ， 我 们 将 看 到 每 一 行 ， 




















结尾 )， 则 执行 while 的 循环 体 。 因 
因此 Perl 提供 了 一 种 简写 方式 。 如 下 : 











争 你 可 能 注意 到 我 们 没有 对 输入 的 字符 串 进 行 chomp 操作 。 在 这 种 类 型 的 循环 中 ， 你 不 能 将 chomp 操作 插入 条 件 表达 式 中 ， 








环 体 的 第 一 条 语句 。 我 们 将 在 下 一 节 中 见 到 此 类 例子 。 











while(<STDIN>){ 
print “Isaw $ 2”; 
} 
为 了 得 到 这 种 简写 ，Larry 使 用 了 一 些 无 用 的 语法 (useless syntax)。 也 就 是 说 : 








、 放 


坦 





如 果 为 真 ， 则 进入 while 循环 ， 然 后 丢掉 它 ! ”。Larry 知 
Larry 利 用 了 这 种 特性 ， 使 之 变 得 有 用 起 来 。 
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实际 上 是 对 一 个 文件 句柄 (filehandle) 的 行 输入 操作 (有 <> 表 示 )。 本 章 后 面 

















将 更 多 的 介绍 文 








法 

















于 ， 行 输入 操作 在 到 达 文 件 的 结尾 时 将 返回 undef， 这 对 于 从 循环 退出 时 非常 方便 的 : 

















是 否 defined， 如 果 是 《意味 着 我 们 没有 到 达 输 入 的 
行 接着 一 行 银 。 你 可 能 经 常 进行 此 类 操作 ， 























: 亩 肖 ' 曰 


通常 是 循 








因此 这 




















“ 读 入 一 行 输入 ， 看 其 是 否 为 真 (通常 为 真 )。 
很 少 有 人 这 样 做 ， 没 人 会 在 实际 的 程序 中 使 用 这 种 方法 。 因 此 ， 

















9/21/2006 


Perl 语言 入 门 (第 四 版 ) 











上 段 程序 实际 完成 的 工作 和 早期 例子 是 一 样 的 : 它 告 诉 Perl 将 输入 读 入 一 个 变量 ，( 只 要 结果 是 defined 的 ， 即 没有 到 达 文 
件 的 结尾 )， 则 进入 wbile 循环 。 但 ， 不 是 将 输入 存储 在 $line， 而 是 放 在 Petl 的 默认 变量 ,$_ 之 中 。 你 也 可 以 这 样 写 : 











while (defined($_ = <STDIN>)){ 
Print “ITSsaw $_”; 


} 











在 进行 深入 讨论 前 , 我 们 要 澄清 一 些 事 : 这 种 简写 只 WA 默认 的 情况 下 不 会 将 一 行 读 入 变量 $_。 仅 当 while 
循环 的 条 件 判 断 部 分 只 包含 Ne 如 果 在 条 件 判 断 部 分 还 有 别 的 内 容 ， 则 上 述 简写 无 效 。 


























争 由 于 for 循环 的 条 件 部 分 和 while 的 条 件 部 分 类 似 ， 它 也 能 正常 工作 。 























除 此 之 外 ， 行 输入 操作 (<STDIN>) 和 Perl 的 默认 变量 〈$_) 没有 别 的 关系 。 在 本 例 中 ， 输 入 的 值 被 保存 在 变量 $_ 中 。 











另 一 方面 , 在 列表 context 中 使 用 行 输入 操作 时 ,， 则 会 将 所 有 的 行 ( 剩 下 的 ) 当 作 一 个 列表 ， 而 每 一 行 作为 列表 的 一 个 元 素 : 





foreach(<STDIN>){ 
Print “Isaw$ 2” 


} 


同样 ， 行 输入 操作 和 Perl 的 默认 变量 $_ 没有 必然 的 联系 。 在 上 例 中 ，foreach 默认 的 控制 变量 为 $_。 因 此 ， 此 循环 将 每 
赋 给 $_。 
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上 面 的 看 起 来 相似 : 好 像 有 理由 认为 它们 的 行为 也 是 相似 的 ， 不 是 吗 ? 


















































它们 在 底层 是 很 不 相同 的 。 在 while 循环 中 ，Perl 读 入 一 行 ， 将 它 赋 给 变量 ， 然 后 进入 循环 。 再 回 到 开头 ， 读 入 下 一 行 。 但 
在 foreach 循环 中 ， 由 于 行 输入 操作 在 列表 的 context 中 使 用 ， 因 为 foreach 需要 一 个 列表 作为 其 参数 。 因 此 ， 它 在 循环 执行 
前 会 将 所 有 的 输入 读 入 。 这 种 区 别 在 读 入 一 个 400MB 的 web 服务 器 的 log 文件 时 非常 明显 。 通 常 使 用 while 循环 是 一 种 更 
好 的 方法 ， 因 为 它 一 次 处 理 一 行 输入 。 










































































S.， 2 从 <> 输 入 





另 一 种 方法 是 使 用 尖 括 号 争 输 入 (diamond operaton: <>。 这 种 方法 对 于 书写 类 似 于 标准 Unix 银 工具 的 程序 非常 有 用 。 如 果 
想 写 一 个 Perl 程序 ,使 它 具 有 像 cat sed, ao 大 sort grep PP 以 及 许多 别 的 应 用 程序 类 似 的 功能 ， 则 <> 将 帮 上 你 的 大 忙 。 对 
于 其 它 方 面 ，<> 可 能 帮 不 上 你 什么 。 
























































争 这 种 操作 由 Larry 的 女儿 ，Heidi 命名 。 有 一 次 Randal 到 Larry 的 家 去 ， 给 他 看 一 些 他 一 些 新 写 的 培训 材料 ， 抱 怨 到 不 知道 怎么 称呼 它 
(<>)。Larry 也 不 知道 怎么 叫 它 。Heidi (当时 只 有 8 岁 ) 突然 说 ，“That's diamond, Daddy”。 因 此 就 这 样 称 呼 它 了 。 谢 谢 ，Heidi。 



























































多 不 仅仅 在 Unix 系统 中 。 许 多 别 的 系统 也 采用 了 这 种 invocation arguments 〈 调 用 参数 ) 的 方法 。 





























一 个 程序 的 调用 参数 〈invocation arguments) , 通常 是 命令 行 中 程序 名 字 后 面 的 一 些 “ 字 符 串 ” 争 。 下 例 中 ， 它 们 是 要 被 顺 
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序 处 理 的 文件 的 名 字 ; 
争 当 程序 开始 运行 运行 时 ， 它 有 0 个 或 多 个 调用 参数 ， 这 由 此 程序 决定 。 这 通常 出 现在 shell 中 ， 此 列表 由 你 命令 行 中 输入 的 内 容 决定 。 在 
后 面 将 看 到 ， 调 用 程序 可 以 使 用 许多 字符 串 作 为 调用 参数 〈invocation arguments)。 由 于 它们 经 常 出 现在 命令 行 中 ， 因 此 有 时 亦 被 称 作 命 
令 行 参 数 (command-line arguments) 。 





$./my_program fred barney betty 











上 述 命令 的 含义 是 ， 运 行 my_program《〈 在 当前 目录 下 )， 它 将 处 理 文件 fred, 再 处 理 文件 barmey， 最 后 是 文件 betty 。 


























如 果 没 有 命令 行 参 数 ， 程 序 将 处 理 标准 输入 流 〈standard input stream)。 作 为 一 个 特例 ， 如 果 将 连接 号 (-) 作为 一 个 参数 ， 其 
含义 也 是 标准 输入 争 . 如 果 调 用 参数 为 fred - betty 其 含义 是 程序 将 首先 处 理 文件 fred, 其 次 是 标准 输入 流 , 最 后 是 文件 betty。 





















































人 这 是 Unix 中 很 少 人 知道 的 一 个 事实 : 如 许多 标准 的 工具 ， 如 cat，sed， 也 使 用 这 种 约定 ， 连 接 号 〈-) 代表 标准 输入 流 。 
































使 用 这 种 方法 来 书写 程序 的 一 个 好 处 是 ， 可 以 在 程序 运行 时 决定 其 输入 。 例 如 ， 你 不 需要 重 写 它 就 可 以 在 管道 (pipeline ) 
中 使 用 (将 在 后 面 讨论 ) 。Larry 将 它 引 入 Perl， 是 因为 他 希望 可 以 容易 的 写 你 自己 的 程序 ， 使 它们 具有 标准 Unix 工具 的 特 
点 ， 甚 至 是 在 Non-Unix 系统 中 。 事 实 上 ，Larry 本 人 就 做 了 大 量 的 此 类 程序 。 由 于 不 同 工 具 提供 商 提供 的 工具 不 同 ，Larry 
可 以 创建 他 自己 的 工具 ， 这 些 工 具 可 以 在 不 同 的 机 器 上 使 用 ， 并 且 其 行为 相同 的 。 当 然 ， 这 意味 着 要 首先 将 Perl 移植 到 这 
些 机 器 上 去 。 














































































































尖 括 号 操作 (<>) 是 一 种 特殊 的 行 输入 操作 。 其 输入 可 由 用 户 选择 儿 : 





多 可 能 是 从 键盘 ， 或 者 不 是 


while (defined($line = <>)){ 
chomp($line); 
Print “It was 多 line that Isawkn ; 


} 


运行 此 程序 ,调用 参数 为 ffed, barney，betty, 则 结果 大 概 如 下 :“It was [aline from file fred]( 文 件 中 fred 的 一 行 ) that Isaw!2” 

“It was [another line from file fred] (文件 fed 中 的 另 一 行 ) that Isaw!”, 直到 文件 fred 的 结尾 。 然 后 ， 将 自动 转 到 文件 
barney， 一 行 一 行 的 输出 ， 最 后 到 文件 betty。 从 一 个 文件 到 另 一 个 文件 之 间 没 有 空 行 ， 当 使 用 <> 时 ， 就 像 输 入 的 是 一 个 大 
文件 一 样 争 。 如 果 输 入 结束 时 ，<> 将 返回 undef〈 同 时 退出 while 循环 )。 















































多 


| 败 


前 的 文件 名 字 被 保存 在 Perl 的 特殊 变量 $ARGYV 中 。 名 字 “- "代表 某 个 文件 ， 如 果 其 为 标准 输入 流 输入 。 





























于 这 是 一 种 特殊 的 行 输入 操作 ， 我 们 也 可 以 使 用 前 面 的 相似 的 简写 方法 ; 




















while(<>){ 
chomp; 
print “It was $_that Isawln”; 


} 
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这 种 方法 和 前 一 例 的 功能 一 样 ， 但 输入 的 字符 更 少 。 你 可 能 注意 到 了 ，chomp 使 用 了 默认 参数 ， 
$ 操作 。 这 又 减少 了 输入 。 






























































用 第 二 个 <>， 通 常 是 想 使 用 $_。 记 住 ，<> 读 入 输入 ， 但 输入 内 容 本 身 被 存储 在 $_( 默 认 的 情形 )。 


























争 如 果 在 第 二 次 使 用 <> 之 前 








新 初始 化 @ARGV， 则 能 得 到 正确 的 结果 。 在 下 一 节 将 介绍 @ARGYV。 

















如 果 <> 不 能 打开 文件 从 中 读 入 ， 它 将 打印 出 一 些 有 用 的 诊断 信息 ， 如 ; 





Can't open wilma: no Such file or directory 


<> 将 自动 转 到 下 一 个 文件 ， 这 和 cat 这 个 标准 工具 是 一 致 的 。 


S. 3 调用 参数 


技术 上 讲 ，<> 从 数组 @ARGY 中 得 到 调用 参数 。 这 个 数组 是 Perl 中 的 一 个 特殊 数组 ， 其 包含 调 月 








由 于 <> 通 常 被 用 来 处 理 所 有 的 输入 ， 因 此 在 同一 个 序 中 重复 使 用 是 不 正确 的 。 如 果 在 同一 个 程序 中 使 用 了 2 次 <>， 特 别 是 
在 while 循环 内 第 二 次 使 用 <> 读 入 第 一 次 <> 的 值 ， 其 结果 通常 不 是 你 所 希望 的 争 。 根 据 我 们 的 经 验 ， 当 初学 者 在 程序 中 使 


没有 变量 时 ，chomp 将 对 











日 参数 的 列表 。 换 名 话说， 





这 和 一 般 数组 没什么 两 样 (除了 其 名 字 有 些 特别 : 全 为 大 写字 母 )， 程序 开 始 运行 时 ,调用 参数 已 被 存在 @ARGYV 之 中 了 @。 

















人 C 程序 员 可 能 想到 argc (Perl 中 没有 )， 和 程序 自身 的 名 字 存 放 在 什么 地 方 等 〈 它 被 存在 Perl 的 特殊 变量 $0 中 ， 而 非 @RAGV ) . 对 于 不 



































同 的 调用 方式 ， 这 可 能 有 些 不 同 。 具 体 的 情况 可 参看 perlrun。 











可 以 像 数 组 那样 使 用 @ARGV ， 如 使 用 shift 将 元 素 移出 ， 或 者 使 用 foreach 进行 欠 代 等 。 甚 者 可 
头 ， 进 而 可 以 做 为 参数 选项 (invocation options) 处 理 它 们 〈 如 Perl 处 理 其 -w 选项 ) 争 。 






































争 如 果 需 要 更 多 的 这 种 选项 ， 那 很 可 能 你 是 使 用 模块 按照 标准 方法 处 理 它 们 。 参 看 Getopt:Long 和 Getopt:Std 这 两 个 模块 ， 它 们 属于 标准 











发 布 的 Perl 中 的 一 部 分 。 








<> 操 作 查 看 @argv 来 决定 使 用 哪些 文件 。 如 果 表 为 空 ， 则 使 用 标准 输入 流 ;， 否则， 使 用 其 找到 的 相应 文件 。 也 就 是 说 ， 在 
局 动 程序 后 ， 使 用 <> 之 前 ， 你 还 有 机 会 修改 @argv 的 值 。 例 如 ， 下 面 程序 可 以 处 理 3 个 指定 的 文件 ， 无 论 用 户 在 命令 行 中 









































输入 了 什么 其 它 的 文件 : 

















@argv = qw# larry mor curly 砷 # 强 制 使 用 这 三 个 文件 
WwWhile(<>){ 
chomp; 
Print “It was $_that Isaw in Some stooge-like filel\n”; 


} 
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以 检查 是 否 某 个 参数 由 - 开 
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5s.， 4 输出 到 标准 输出 设备 


Print 操作 将 传 给 它 的 依次 输出 到 标准 输出 设备 中 ， 一 个 接着 一 个 。 不 会 在 这 些 元 素 之 前 ， 之 后 ， 或 之 中 加 入 任何 字符 命 。 
如 果 想 在 其 间 加 入 空格 ， 在 结尾 加 入 换行 符 ， 那 需 具 体 指定 它 ; 

















急 默 认 情 况 下 ， 不 会 加 入 任何 的 字符 ， 但 这 种 默认 行为 (就 像 Perl 中 别 的 default 一 样 ) 是 可 以 改变 的 。 改 变 这 种 默认 值 ， 可 能 影响 你 的 维护 
人 员 ， 因 此 应 当 尽量 避免 它 ， 除 非 在 一 些小 的 ，quick-and-dirty 程序 ， 或 者 程序 的 一 小 段 中 。 参 看 perlvar 的 帮助 手册 ， 学 习 改 变 这 种 默 
认 值 的 方法 。 
































$name =“Larry Wall”; 
print“Hello there, $name , did you know that 3+4 is”, 3+4， Nm ; 


当然 ， 打 印 数组 和 内 插 一 个 数组 是 不 同 的 : 


Print @array: # 打 印 出 元 素 的 列表 
print“@array”; # 打 印 一 个 字符 串 ( 包 含 一 个 内 插 的 数组 ) 























第 一 个 语句 打印 出 所 有 的 元 素 ， 一 个 接着 一 个 ， 其 中 没有 空格 。 第 二 个 打印 出 一 个 元 素 ， 它 为 @array 的 所 有 元 素 ， 其 被 在 
在 一 个 字符 串 中 。 也 就 是 说 ， 打 印 出 @array 的 所 有 元 素 ， 并 由 空格 分 开 争 。 如 果 @array 包含 qw /fred barney betty / 争 ， 则 
第 一 个 例子 输出 为 : fredbarneybetty， 而 第 二 个 例子 输出 为 fred barney betty 〈 由 空格 分 开 )。 








争 是 的 ， 空 格 也 为 默认 值 。 参 见 perlval 


多 你 知道 此 处 我 们 指 的 是 三 个 元 素 的 列表 ， 对 吧 ? 





在 决定 使 用 第 二 种 方法 前 ， 想 象 @array 为 一 个 unchomped 的 输入 列 。 也 就 是 说 ， 每 一 个 字符 串 都 有 一 个 换行 符 作为 后 绥 。 
现在 第 一 个 print 语句 输出 为 fed，barney，betty， 分 别 在 三 行 中 。 第 二 个 print 语句 输出 为 : 














fred 
barney 
betty 





你 知道 空格 是 哪里 来 的 吗 ?Perl 在 内 插 数 组 时 ， 它 会 在 元 素 之 间 加 入 空格 。 我 们 得 到 数组 的 第 一 个 元 素 (fred 和 换行 符 ) ， 空 
格 ， 数 组 的 第 二 个 元 素 (barney 和 换行 符 ), 空格 ， 数 组 的 最 后 一 个 元 素 (betty 和 换行 符 ) 。 结 果 是 数组 除了 第 一 个 元 素 之 外 
元 素 都 被 缩 进 了 。 每 隔 一 周 或 者 两 周 ，comp.lang.perlLmisc 的 新 闻 组 上 就 会 出 现 如 下 的 消息 : 




















不 用 阅读 这 些 消息 ， 我 们 就 知道 程序 中 对 数组 使 用 了 双 引 号 ， 数 组 含有 unchomped〈 没 有 去 掉 末 尾 的 换行 符 : 译 者 注 ) 的 
字符 串 。 当 问 到 :“ 你 对 unchomped 的 数组 使 用 了 双 引 号 吗 ?”, 答案 通常 是 yes. 

















如 果 ， 字 符 串 包 含 换行 符 ， 如 果 想 输出 它们 ， 通 和 党: 


print @array; 
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如 果 不 包含 换行 符 ， 通 常 想 加 上 一 个 : 











Print“@array\n ; 





如 果 使 用 了 双 引 号 ， 通 常 要 加 上 \n。 这 能 帮助 你 区 别 开 来 。 


























通常 ， 需 要 把 程序 的 输出 先 缓存 起 来 。 将 要 输出 的 内 容 先 缓存 起 来 ， 等 到 有 足够 的 内 容 再 输入 ， 而 非 立 刻 就 输出 。 例 如 ， 
假设 要 把 输出 的 内 容 存 入 磁盘 ， 如 果 有 一 个 或 两 个 字符 就 立刻 输出 到 磁盘 中 ， 这 将 非常 缓慢 和 低 效 。 一 般 ， 先 将 要 输出 的 
内 容 存 入 一 个 缓存 bufften 中 ， 当 缓存 满 时 ， 再 将 其 输出 。 通 常 ， 我 们 希望 这 样 做 。 












































T、 


担 如 果 你 的 程序 需要 你 立刻 输出 , 则 希望 每 一 次 print 时 ， 就 和 输出。 参照 Perl 的 帮助 手册 ， 了 解 更 多 的 关于 控制 缓存 的 信息 。 


























于 print 需要 一 些 输 出 的 字符 串 列 表 ， 则 其 参数 是 作为 列表 context 来 求 值 的 。 由 于 <> 操 作 返 回 的 是 列表 ， 则 它们 可 很 好 
的 一 起 工作 : 


























print <>; # “cat' 的 源 程序 
Print Sort <>; #'sort 的 源 程序 

















坦白 讲 , 标准 Unix 命令 cox 和 or 还 有 些 其 它 功 能 是 上 述 程序 所 缺乏 的 , 但 不 能 低估 上 述 程序 的 价值 ! 现 在 你 可 以 使 用 Perl 
来 实现 标准 的 Unix 工具 ， 再 将 其 移植 到 任何 装 有 Peal 的 机 器 上 ， 无 论 上 述 机 器 是 否 运 行 Unix。 并 且 ， 上 述 程序 在 不 同 的 
机 器 上 有 相同 的 行为 争 。 




































































多 事实 上 ，Perl Power Tools(PPT) 项 目的 目标 是 将 所 有 传统 的 Unix 工具 在 Perl 中 实现 ， 它 们 几乎 实现 了 所 有 的 工具 〈 包 括 大 多 数 的 游戏 )， 
当 在 如 何 实现 shell 时 被 难 住 了 。PPT 项 目 是 成 功 的 ， 因 为 在 大 多 数 non-UNIX 系统 中 实现 了 标准 的 Unix 工具 。 











































































































还 有 一 点 需要 说 明 的 是 ，print 还 有 可 选 的 括号 ， 它 在 菜 些 时 候 可 能 引起 混淆 。 记 住 Penl 中 关于 括号 的 规则 :如果 括号 不 能 
改变 语句 的 意义 ， 则 其 就 是 可 选 的 。 下 面 是 输出 茶 个 相同 语句 的 不 同 的 方法 : 









































Print (Hello, worldNn ); 
pirnt “Hello, worldl\n ; 






































Perl 的 另 一 个 规则 是 : 如 果 调 用 print 的 方法 看 起 来 是 函数 调用 ， 则 它 就 是 函数 调用 。 这 条 规则 很 简单 ， 但 看 起 来 像 函 数 调 
用 是 啥 含义 呢 ? 



































在 函数 调用 中 ， 函 数 名 字 后 面 会 紧 接 着 银 括 号 ， 其 中 为 函数 的 参数 ， 如 下 : 











争 我 们 说 “ 紧 接 着 ”, 是 说 Perl 在 这 类 函数 调用 中 , 函数 名 字 和 开 括 号 之 间 不 能 有 换行 符 。 如 果 有 换行 符 ，Perl 则 将 此 代码 看 作 列表 操作 ， 
而 非 函 数 调用 。 想 了 解 更 多 的 信息 ， 可 以 参看 帮助 手册 。 


















































Print (2+3); 














上 述 代 码 看 起 来 像 函数 调用 ， 它 实际 上 就 是 函数 调用 。 其 输出 为 5， 然 后 返回 一 个 值 ， 这 和 其 它 函 数 调用 一 样 。print 返回 
值 为 true 或 者 false， 表 明 print 成 功 或 者 失败 。 通 常 是 成 功 的 ， 除 非 遇 到 IO 错误 ， 因 此 ， 下 面 语句 中 $result 的 值 通常 为 1: 
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$result = Print(“hello worldn); 








如 果 以 其 它 方式 来 使 用 返回 值 呢 ? 假如 想 把 返回 值 乘 以 4: 























Print (2+3)*#*4; #oops! 











当 Perl 遇 到 上 述 代码 时 ， 将 输出 S。 然 后 将 print 的 返回 值 1， 乘 以 4。 其 结果 被 丢弃 了 ， 因 为 没有 将 其 值 赋 给 任何 变量 。 
现在 ， 有 些 人 可 能 会 说 :“ 嘿 ，Perl 不 能 进行 数学 运算 ! 应 该 输出 20， 而 非 5! 




































































这 是 由 括号 是 可 选 的 引起 的 ， 有 时 ， 人 会 忽略 括号 属于 哪 一 部 分 。 当 没有 括号 时 ，Pprint 是 一 个 列表 操作 ， 将 后 面 的 所 有 元 
素 输出 来 ， 这 通常 是 你 所 希望 的 。 当 print 后 面 是 一 个 开 括号 时 ，print 为 函数 调用 ， 它 将 输出 括号 中 的 内 容 。 由 于 上 述 代码 
中 有 括号 ， 则 它 等 同 于 下 面 的 代码 : 






























































(print (2+3)) * 4; #oops! 





弟 运 的 是 ， 如 果 打 开 了 和 警告 时 (warnings)，Perl 会 提示 你 。 因 此 至 少 在 程序 的 开发 和 调试 阶段 ， 使 用 -w 或 者 use warnings，, 。 























上 述 规则 ， 对 于 Perl 中 所 有 的 列表 函数 都 是 有 效 的 ， 不 仅仅 是 Print 但 print 可 能 是 最 容易 引起 人 注意 的 。 如 果 print( 或 者 
别 的 函数 ) 后 面 紧 接着 一 个 开 括 号 ， 则 要 确保 闭 括号 在 所 有 的 参数 之 后 。 
































争 0 人 参数 或 者 1 参数 的 函数 不 会 遇 到 这 种 问题 。 


S. S 使 用 printf 格式 化 输出 


你 可 能 需要 对 输出 有 比 print 更 多 的 控制 。 也 许 ， 你 习惯 了 C 提供 的 格式 化 输出 函数 : printt， 担 心 Perl 中 没有 提供 相同 的 
名 字 ， 类 似 功能 的 的 函数 。 


























Printf 函数 有 一 个 格式 字符 串 (format string)， 后 接 需 要 输出 的 字符 串 列 表 。 格 式 争 字符 串 ,， 是 一 个 模板 ， 它 规定 输出 的 格式 : 



































旬 这里， 我 们 按照 一 般 意 义 来 使 用 “format"。Perl 有 报告 生成 Ceportgenerating) 的 功能 ， 称 为 “formats"。 现 在 我 们 不 打算 讨论 它 。 














printf “Hello, %s; your pasSword expires in %d daysl\n ， 
$usen $days_to_die; 











格式 字符 串 中 有 一 些 被 称 作 格式 符 (conversion) 的 东西 ;每 一 个 格式 符 由 百 分 号 (%) 开 头 ， 由 字母 结束 。( 很 快 我 们 将 看 到 ， 
在 这 两 个 字符 之 间 可 以 有 其 它 字 符 )。 后 面 元 素 个 数 和 格式 符 的 个 数 是 一 致 的 。 如 果 不 等 ， 则 不 能 正确 执行 。 上 述 代码 中 后 
面 有 2 个 元 素 ， 有 2 个 格式 符 。 因 此 输出 类 似 于 ; 



































Hello, meryn; your pasSword expires in 3 days! 














Print 有 许多 的 的 格式 符 ， 此 刻 我 们 介绍 最 名 用 的 。 当 然 ， 详 细 的 信息 请 参见 perlfunc 的 帮助 手册 。 


























要 输出 数字 ， 通 常 使 用 %g 合 , 它 将 根据 需要 自动 选用 浮 点 数 ， 整 数 ， 或 者 指数 : 
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争 “Geneal" numeric conversion〈 通 用 数字 格式 符 ) 或 者 是 “Good conversion for this number” (关于 这 个 数字 的 好 的 格式 符 ) 抑或 “Guess 
what I want the output to look like.”( 猜 猜 我 将 怎样 输出 ) 





%d 为 十 进 制 争 整 数 ， 根 据 需要 而 截 尾 : 











急 %x 是 针对 十 六 进 制 的 ，%o 是 针对 八进制 的 。 








Print “in %d dayst\m ,17.83; 抽 n 17 daysS! 





上 述 结果 被 截 尾 了 ， 而 非 变 成 和 它 最 相近 的 整数 ， 后 面 将 讨论 怎样 变 成 最 相近 的 整数 。 








在 Perl 中 ，printft 中 的 数据 通常 会 接受 一 个 宽度 值 。 如 果 数 据 不 能 满足 这 个 宽度 ， 则 会 自动 扩展 开 来 : 





printf “%6fm7” 42; # 输 出 为 ”oooo42 (〈o 此 处 指 代 空 格 ) 
printf “%23\n ,2e3+1.95; #2001 





%s 是 针对 字符 串 的 ， 例 如 : 


printf “910sm”“wilma”; 玫 偷 出 为 : oooo owilma 





如 果 宽 度 值 为 负数 ， 则 为 左 对 齐 〈 对 于 所 有 的 格式 符 ): 


print “9%-15$s\n" “flintstone”; # 输 出 为 fliintstoneoooo 





% 寻 根据 需 要 进行 截 尾 ， 你 可 以 设置 需要 几 位 小 数 点 后 面 的 数字 : 











printf “9%12fun”, 6*7 + 2/3; # 输 出 为 : ooo42.666667 
Printf “9%12.3fn”, 6#*7 + 2/3; # 输 出 为 : oooooo42.667 
printf “9%12.0fn” 6*7 + 2/3; 枚 偷 出 为 : oooooooooo43 








要 输出 一 个 百 分 号 ， 可 以 使 用 % 吧 ， 它 不 会 使 用 后 面 列表 中 的 元 素 命 : 








急 你 可 能 认为 可 以 在 百 分 号 前 使 用 反 斜 线 〈\)。 你 可 以 试 试 ， 但 这 是 不 正确 的 。 它 不 能 正确 工作 的 理由 是 ， 格 式 是 表达 式 ，'""\%7” 是 指 一 个 
字符 的 字符 串 “%" 。 故 虽然 我 们 在 格式 字符 串 中 使 用 了 反 和 斜 线 ，printf 函数 并 不 知道 怎样 处 理 它 。C 程序 员 可 以 使 用 者 这 种 方法 来 处 理 。 




































































print “Monthly interest Tate: %.2f%9oNn ， 
5.25/12; 押 痊 出 的 值 为 0.449% 





5.5.1 数组 和 printf 


通常 ， 不 会 将 数组 作为 参数 传递 给 printf。 因 为 数组 可 能 含有 任意 数量 的 元 素 ， 而 某 个 给 定 的 格式 字符 串 仅 对 同 定 数量 的 参 
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数 有 效 ， 如 果 格 式 化 字符 串 中 有 3 个 格式 符 ， 则 对 应 3 个 元 素 。 





















































变量 中 可 能 会 带 来 方便 〈 特 别 是 调试 的 时 候 ): 





my @items = qw( wilma dino pebbles ); 
Imy $format = “The items arexn” . (9%10Sm X Qitems); 
寿 print “the format is >>$format<<\vn7”  # 用 于 调试 


printf $format，@items; 








上 述 代 码 中 使 用 了 x 操作 (在 第 二 章 中 学 习 过 ), 来 确定 字符 串 要 重复 的 次 数 , 此 次 数 有 G@items 胡 

















但 没有 理由 因为 表达 式 可 以 是 任意 的 ， 就 不 能 指定 一 个 格式 字符 串 。 这 需要 一 些 技巧 才能 使 之 正常 工作 ， 如 果 将 格式 存 入 




















和 定 〈 此 时 是 在 标量 context 





中 使 用 的 )。 本 例 中 为 3， 因 为 有 3 个 元 素 ， 因 此 上 述 的 格式 字符 串 等 同 于 “The items are:ml0sm10sm10sm”。 输 出 的 每 一 个 











元 素 占 一 行 ， 右 对 齐 ， 长 度 为 10。 相 当 酷 ， 对 吧 ? 还 有 更 好 的 方法 ， 可 以 把 它们 结合 起 来 使 用 : 








Printf “The items are\n” .(%10sSn XxX Qitems), Qitems; 





本 例 中 使 用 了 @items 两 次 ， 一 次 在 标量 context 中 ， 取 其 元 素 的 个 数 ， 一 次 在 列表 context 中 取 





的 。 


S. 6 句柄 


























元 素 。context 是 相当 重要 


文件 句柄 (filehandle) 是 Perl 程序 IO 连接 的 名 字 ， 是 Perl 和 外 界 的 纽带 。 也 就 是 说 ， 它 是 连接 的 名 字 ， 而 非 文件 的 名 字 。 





文件 句柄 的 命名 规则 和 Perl 中 其 它 标识 符 一 样 "由 字母 ， 数字 ， 下 划 线 组 成 ， 但 不 能 由 数字 开头 ) 由 于 没有 任何 的 前 缀 符 ， 
和 标签 一 样 ，Larry 推荐 文件 句柄 的 所 有 字母 均 大 


这 可 能 和 现在 或 者 将 来 的 保留 字 ， 标 签 〈 在 第 十 章 中 介绍 ) 混淆 。 因 此 ， 
写 。 这 有 利于 阅读 ， 并 且 能 保证 程序 在 引入 新 的 保留 字 《〈 人 小写) 后 仍 能 















































正确 执行 。 





























Perl 自身 有 六 个 文件 句柄 : STDIN，STDOUT，STDERR ，DATA，ARGV，ARGVOUT 。 虽 然 可 以 任意 给 文件 句柄 命名 ， 

















一 、 


且 不 能 选择 上 面 六 个 ， 除 非 你 想 利 用 它们 的 某 些 特 殊 性 质 争 。 























争 有 些 人 不 喜欢 使 用 全 部 大 写 的 字符 串 ， 他 们 喜欢 使 用 小 写字 母 ， 如 stdin。Penl 可 能 让 它 正 确 执 行 ， 但 这 并 非 是 善 适 的 。 它 们 在 何 时 正 





















































执行 ， 何 时 会 失败 不 在 本 书 讨论 范围 之 内 。 需 要 指出 的 是 ， 如 果 你 的 程序 依赖 这 种 性 























一 天 失败 ， 因 此 最 好 避免 使 用 小 写 的 形式 。 























急 某 个 情况 下 ， 这 要 使 用 不 会 有 任何 问题 。 当 你 的 维护 人 员 可 能 会 混淆 。 














汉 





它 现 在 能 1 














: 确 执行 ， 也 很 可 能 在 将 来 的 某 





= 


前 











你 可 能 还 记得 其 中 一 些 句 柄 的 名 字 。 当 程序 运行 时 ，STDIN 连接 Perl 当前 处 理 的 部 分 和 其 他 输入 来 源 ， 其 一 般 被 称 作 标准 
输入 流 。 通 常 ， 是 指 键盘 ， 除 非 指 定 了 别 的 输入 源 ， 如 文件 或 者 另 一 个 程序 的 输出 ， 通 过 管道 (pipe) 争 。STDOUT 是 标准 
输出 流 。 默 认 情 况 ， 这 是 指 用 户 的 显示 屏 ， 但 可 以 将 其 输出 到 文件 ， 或 者 另 一 个 程序 中 ， 我 们 将 很 快 看 到 。 这 些 标准 流 来 






































源 于 Unix 的 标准 IO 库 ， 但 它们 在 大 多 数 的 当代 操作 系统 争 中 都 能 正确 工作 。 一 











写 出 到 STDOUT， 相 信用 户 〈 或 者 启动 此 程序 的 程序 ) 能 正确 地 设 定 。 
下 的 命令 : 
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于 上 述 原 





























股 的 思想 是 ， 


因 ,， 用 户 就 可 以 在 shell 提示 符 中 输入 如 








口 











程序 





AAA 


是 从 STDIN 读 入 ， 
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争 本 章 中 我 们 讨论 的 3 种 主要 的 IO 流 是 Unix shell 默认 情况 下 使 用 的 。 但 不 是 只 有 shell 能 调 入 程序 。 我 们 在 第 十 四 章 中 讨论 当 由 Perl 调 
入 时 将 发 生 什 么 事 。 



































争 如 果 不 热 悉 你 的 Non-Unix 系统 提供 的 标准 输入 输出 设备 ， 可 以 参看 perlport 的 帮助 手册 ， 来 查看 其 和 Unix shell (运行 程序 的 程序 ， 依 
赖 于 键盘 的 输入 ) 的 等 价 物 。 








$./your_program <dino >Wilma 








上 述 命令 告诉 shell， 从 一 个 名 叫 dino 读 入 ， 将 结果 输出 到 叫做 wilma 的 文件 之 中 。 由 于 程序 从 STDIN 读 入 ， 处 理 它 〈 按 
照 我 们 的 要 求 )， 再 输出 到 STDOUT， 上 述 代码 将 能 很 好 工作 。 






































不 需要 额外 的 代价 ， 上 述 程序 能 很 好 的 在 管道 中 使 用 。 这 是 Unix 的 另 一 个 概念 ， 可 以 让 我 们 如 下 的 写 命令 : 











$ cat fred barney | sort | ./your_program | grep Something 1]pr 








如 果 你 不 熟悉 Unix 命令 ， 也 不 要 紧 。 上 面 一 行 的 含义 是 : cat 命令 将 输出 文件 fred 的 所 有 行 ， 紧 接着 是 文件 barney 的 所 有 
行 。 这 个 输出 作为 sort 的 输入 ， 它 将 所 有 的 输入 的 行进 行 排序 ， 再 将 结果 传递 给 your_program。 经 过 your_program 处 理 后 ， 
将 结果 传 给 grep， 它 会 将 某 些 行 去 除 掉 ， 然 后 送 给 ]jpr， 它 会 将 传 给 它 的 数据 打印 出 来 。 
























































像 上 面 那样 的 管道 命令 在 Unix 和 许多 别 的 系统 中 非常 第 见 ， 因 为 它们 可 以 让 你 通过 简单 的 ， 标 准 命令 创建 强大 的 ， 复 杂 的 
命令 。 每 一 个 小 的 命令 完成 一 件 事情 ， 你 的 任务 就 是 准确 地 组 合 它 们 。 


















































还 有 一 种 标准 的 IO 流 。 如 果 your_program 有 警告 (warnings) 或 者 诊断 (diagnostic) 信 息 , 这 些 信息 不 应 当 在 管道 中 传递 。grep 
命令 可 以 去 掉 任 何 没 有 特别 指定 的 信息 ， 因 此 很 可 能 去 掉 了 warnings。 即 便 它 保留 了 这 些 warnings， 你 很 可 能 不 希望 把 这 
些 信 息 在 管道 中 传递 下 去 。 这 就 是 为 什么 还 有 标准 错误 流 的 原因 : STDERR。 标 准 输出 可 以 输出 到 另 一 个 程序 或 者 文件 ， 

错误 可 以 输出 到 用 户 指定 的 任何 地 方 。 默 认 情况 下 ， 错 误 将 输出 到 用 户 的 显示 屏 争 ， 但 用 户 可 能 把 错误 输出 到 文件 中 ， 如 


下 面 的 命令 : 
















































































@ 通 常 ， 错 误 是 不 会 被 缓存 的 。 这 就 使 说 ， 如 果 标 准 输出 流 和 标准 错误 都 是 输出 到 同一 个 地 方 〈《 如 显示 器 )， 则 错误 通常 会 出 现在 普通 输 
的 前 面 。 例 如 ， 你 的 程序 输出 普通 文件 的 一 行 ， 和 除 以 0， 则 通常 会 先 显示 除 以 0 的 《错误 ) 信息 ， 然 后 才 是 文件 的 内 容 。 





















































$netstat | ./your_program 2>/tmp/my_errors 


s. 7 文件 句柄 的 打开 


你 已 经 见 过 了 Perl 提供 的 3 种 文件 句柄 : STDIN, STDOUT STDERR。 当 需 要 其 它 的 文件 句柄 时 ,使 用 open 操作 通知 Perl， 
Perl 再 请 求 操 作 系统 来 建立 同 外 部 的 连接 。 下 面 是 一 些 例 子 ; 











open CONFIG，“dino”; 
open CONFIG，“<dino”; 
open BEDROCK，>fred ; 
open LOG，“>>logfile”; 
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第 一 例 中 打开 了 一 个 名 为 CONEFIG 的 文件 句柄 ， 它 指向 dizo 文件 。 
这 和 从 文件 中 取 数 据 ， 也 可 以 通过 STDIN 得 到 是 类 似 的 ， 如 果 在 命令 行 中 使 
<dino。 第 二 例 和 第 一 例 类 似 ; 它 和 第 一 例 是 
情况 就 是 输入 〈 没 有 <) 争 。 





CONFIG 传 给 程序 。 














4 这 可 能 引起 严重 的 安全 问题 。 正 如 我 














用 户 指定 的 文 伯 


会 更 加 安全 , 因 


























一 样 的 ， 只 是 < 明 胡 
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特别 是 和 安全 相关 的 信息 ， 可 以 参看 perlopentut 的 帮助 手册 。 


泗 














打开 文件 进行 输入 ， 





一 般 不 需要 使 用 <， 我 们 这 
例 中 打开 文件 句柄 BEDROCK， 输 出 到 新 文件 fed 中 。 和 shell 

















如 果 存 在 这 样 的 文件 ， 则 清空 它 ， 并 将 新 的 数据 写 入 。 





第 四 个 例子 中 使 用 了 两 个 大 于 号 >>)( 和 shell 一 样 )， 它 打 姑 
将 把 新 数据 添 在 后 面 。 如 果 文 从 
































角 的 指明 了 


j。 但 是 ， 


门 即将 看 到 的 《在 第 十 四 章 有 详细 讨论 )。 文 件 名 可 能 使 用 了 一 些 magical 字符 串 。 如 果 $name 有 
名 ， 打 开 $name 将 允许 这 些 magical characters 能 执行 。 这 对 于 用 


为 它 严 格 指明 了 将 打开 的 文件 名 作为 输入 来 使 





户 可 





这 仍 不 能 阻 | 





[一 个 文件 ， 数 据 追 加 到 文件 后 面 。 
不 存在 ， 则 和 大 于 号 (>) 一 样 ， 创 建文 件 ， 并 把 数据 写 入 。 这 对 于 


文件 diro 将 被 打开 ， 其 所 包含 的 数据 通过 
了 shell 重 定位 操作 如 


























“使 用 这 个 文件 进行 输入 操作 ”， 虽 然 默认 的 


















































能 非常 方便 ， 但 其 存在 安全 漏洞 . open < $name 将 











止 所 有 的 问题 。 想 了 解 更 多 的 关于 打开 文件 的 信息 ， 











介绍 的 原因 是 ， 在 第 三 例 中 ， 使 用 了 大 于 号 C) 来 表明 是 文件 的 输出 。 此 
定位 中 使 用 的 大 于 号 一 样 ， 我 们 将 输出 送 到 文件 .jed 中 。 











也 就 是 说 ， 如 果 文 件 存在 ， 
志 (log) 文 件 是 非常 方 



































便 的 ; 程序 可 以 每 次 添加 写 的 日 志 到 log 文件 中 。 这 也 是 把 第 四 例 中 的 文件 句 检 








可 以 在 文件 名 的 地 方 使 用 任何 的 标量 表达 式 ， 虽 然 通 第 你 可 能 不 想 这 样 做 ; 


my $selected_ouU 
open LOG “> $s 





注意 大 于 号 后 








tput = “my_output ; 


elected_output ; 





变 成 追加 。 


急 是 的 ， 如 果 文 伯 











Per1l 的 新 版 本 中 〈 从 Per15.6 





FF 名 前 有 空格 ，Perl 将 忽略 它 。 











open CONFIG，“< ”dino”; 


open BEDROCK， 


open LOG“>>”， 


这 种 方法 的 优点 是 Perl 不 会 将 模式 〈 第 二 个 参数 ) 和 文 作 
望 你 的 程序 能 和 早期 的 Perl 兼容 〈 如 - 





“>”, $file_name; 
久 logfile_name(O); 


















































开始 )，open 支持 “3 参数 ”类 型 : 














急 这 方面 的 安全 问 


对 

















we 











争 例 如 use 5.6. 
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题 是 ， 它 能 让 某 些 恶 意 / 








户 的 输入 进行 检测 。 如 果 你 的 程序 存在 潜在 的 恶意 








查看 perlfunc 和 perlopentut 了 解 更 多 的 信息 。 


j 户 将 有 恶意 的 字符 注入 你 的 程序 之 中 。 当 学 完 正 则 表达 式 〈 第 七 童 开 始 ) 之 后 ， 你 可 以 利用 























在 本 章 后 面 我 们 将 介绍 如 何 使 用 这 些 文件 句柄 。 
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j 户 ， 你 可 以 阅读 Alpaca 中 关于 安全 问题 的 论述 ， 或 者 查看 perlsec 的 帮助 文档 。 








叫做 LOG， 文 件 叫 做 Togjiie 的 原因 。 


看 的 空格 。Perl 会 忽略 它 争 ， 但 它 防 止 可 能 出 现 的 异常 情况 。 如 ， 当 $selected_output 为 “passwd”， 则 它 将 





F 的 名 字 【《 第 三 个 参数 ) 混淆 ， 这 能 增加 安全 性 争 。 但 ， 如 果 你 希 
上 传 到 CPAN )， 则 尽量 避免 使 用 这 种 方法 ， 或 者 标明 其 只 对 5.6 版 本 之 后 的 有 效 合 。 
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5. 7. 1 Bad 文件 句柄 











Perl 自身 不 能 打开 文件 。 和 许多 其 它 语言 类 似 ，Perl 请 求 操作 系统 来 打开 文件 。 当 然 ， 操 作 系统 可 能 拒绝 打开 ， 如 权限 问 
题 ， 不 正确 的 文件 名 等 等 。 


























如 果 从 一 个 bad 文件 句柄 读 入 《文件 句柄 没有 恰当 的 打开 )， 会 立刻 到 达 文 件 结尾 (end-of-file)。( 有 共 体 的 IO 方法 在 本 章 后 


面 有 介绍 ，end-of-file 




















在 标量 context 中 由 undef 标明 ， 在 列表 context 中 由 空 列表 (empty lisb 标 明 )。 如 果 写 到 一 个 bad 文件 





句柄 ， 数 据 会 被 悄悄 地 丢掉 。 























幸运 的 是 ， 上 述 可 怕 的 结果 可 以 被 避免 。 首 先 ， 可 以 使 用 -w 或 者 use warnings，Perl 通常 能 告诉 我 们 如 果 使 用 了 一 个 bad 




















文件 句柄 。 如 果 不 使 














写 代码 : 


j 它 ，open 也 能 通过 返回 的 是 真是 假 来 告诉 我 们 《成功 打开 为 真 ， 打 开 失 败 返回 假 )。 你 可 以 如 下 的 








my $success = open LOG, “>>logifle”; # 将 返回 值 保 存在 $success 中 


让 (!$success){ 


# 打 开 失 败 时 

















你 可 以 这 样 做 ， 但 下 








节 还 有 别 的 方法 。 





5. 7. 2 关闭 文件 句柄 





由 








close BEDROCK; 


当 关 闭 文件 句柄 时 ，P 








文件 句柄 。 


结束 一 个 文件 句柄 时 ， 你 可 以 如 下 这 样 关 闭 它 : 








erl 将 告诉 操作 系统 已 经 结束 了 对 此 数据 流 的 操作 ， 因 此 应 当 将 输出 的 数据 写 到 磁盘 中 ， 可 能 某 人 正 




















册 [ 





在 等 待 使 用 它 争 。 如 果 程 序 重新 打开 它 〈 也 就 是 说 ， 使 用 open 重新 打开 此 文件 句柄 )， 或 者 退出 程序 争 ，Perl 将 自动 关闭 












































争 如 果 对 系统 的 TO 有 足够 的 了 解 ， 你 将 知道 更 多 的 信息 。 通 常 ， 文 件 句 柄 被 关闭 时 ， 下 面 就 是 可 能 发 生 的 事 : ”如 果 还 有 输入 存在 于 文 





件 中 ， 则 被 忽略 。 
《数据 被 传 走 )。 




















如 果 还 有 数据 存在 于 管道 (pipeline) 中 ， 则 写 入 程序 收 到 管道 关闭 的 信号 。 如 果 输 出 到 文件 或 管道 中 ， 则 缓存 被 清空 
如 果 文 件 句 柄 被 锁 住 ， 则 和 解锁。 参阅 系统 的 IO 文档 了 解 更 多 的 信息 。 



























































急 无 论 什 么 原因 ， 从 程序 退出 将 关闭 文件 句柄 ， 如 果 Perl 被 中 断 ， 则 缓存 中 的 数据 被 清空 。 也 就 是 说 ， 如 果 你 的 程序 由 于 除 以 0 等 错误 
而 退出 ，Perl 将 继续 运行 ， 确 保 数据 能 正确 地 输出 。 如 果 Penl 停止 运行 《内存 不 够 ， 或 者 收 到 红 常 的 信号 (unexpected singal ))， 则 最 








互 


后 的 数据 可 能 不 全 























最 好 在 不 使 用 一 个 文 们 






































写 到 磁盘 中 。 但 是 ， 这 通常 不 是 





要 的 问题 。 






































于 这 些 原因 ， 许 多 Perl 程序 没有 考虑 close。 但 是 ， 如 果 和 希望 程序 更 加 整洁 ， 则 每 一 个 open 都 应 当 使 用 一 个 close。 通 常 ， 
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句柄 时 就 立刻 将 它 关 闭 ， 无 论 程序 是 否 立 即 结束 争 。 
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争 关 闭 文件 句柄 将 清空 缓存 ， 并 释放 文件 的 锁 。 由 于 可 能 有 人 会 使 用 某 个 文件 ， 因 此 对 于 运行 时 间 很 长 的 程序 ， 应 当 在 可 能 的 情况 下 早 
点 关闭 名 柄 。 但 大 量 的 程序 上 只 运行 一 秒 或 者 两 秒 ， 因 此 是 否 关 闭 无 关 紧 要 。 关 闭 文件 句柄 也 会 释放 某 些 有 限 的 资源 。 
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S. 8 严重 错误 和 die 


我 们 先 贫 开 下 话题 。 本 节 中 我 们 讨论 不 是 直接 和 IO 相关 的 问题 ， 而 是 怎么 从 程序 中 比 正 常情 况 更 早退 出 的 技术 。 








人 











当 Perl 内 部 发 生 了 一 个 严重 错误 (fatal erronD)( 例 如 ， 除 数 为 0， 或 者 使 用 了 无 效 的 正则 表达 式 ， 或 者 调用 了 一 个 未 声明 的 函 
数 )， 程 序 将 停止 运行 ， 并 告诉 你 失败 的 原因 争 。 可 以 利用 die 函数 来 创建 我 们 自己 的 严重 错误 。 














银 这 是 默认 的 情况 。 参 看 第 十 六 章 了 解 更 多 的 信息 。 


证 











die 函数 将 打印 出 你 给 它 的 消息 〈 利 用 标准 错误 流 )， 并 确保 程序 退出 时 为 非 零 (nonzero) 的 退出 状态 〈exit status ) 。 


























你 可 能 不 知道 它 ， 但 每 一 个 Unix《〈 以 及 许多 当代 的 操作 系统 ) 上 的 程序 均 有 一 个 退出 状态 ， 来 表明 是 否 成 功 。 运 行程 序 的 
程序 〈 如 meke 工具 程序 ) 通过 查看 退出 状态 来 分 析 程 序 的 运行 状况 。 退 出 状态 是 一 个 单字 节 ， 不 能 说 明 什么 问题 ， 传 统 
上 ，0 表示 成 功 ， 非 0 表示 失败 。 可 能 1 是 指 命令 行 中 命令 参数 的 语法 错误 ，2 指 运行 错误 ，3 指 没 有 找到 配置 文件 ， 具 体 
青 况 和 有 具体 程序 相关 。 但 0 通常 是 指 一 切 正 常 。 当 退出 状态 表明 失败 时 ， 像 make 一 类 的 程序 就 停止 进行 下 一 步 处 理 。 


























一 














现在 我 们 重 写 上 一 的 例子 ， 如 下 : 


it(!Iopen LOG“>>logfile ){ 
die “Cannot create logfile:$!; 


} 








如 果 open 失败 ， 则 die 将 结束 程序 ， 并 告诉 你 不 能 创建 logfile。 但 ， 消 息 中 的 $! 是 指 什么 呢 ? 它 是 系统 产生 的 一 些 可 读 的 
信息 。 通 常 ， 当 系统 拒绝 了 我 们 的 请 求 如 打开 文件 )，$! 将 告诉 你 原因 《可 能 是 “权限 不 够 (permission denied)” 或 者 “( 文 
件 不 存在 )file not found"， 针 对 本 例 )。 这 个 字符 串 和 你 在 C 或 者 类 似 的 语言 中 通过 perror 得 到 的 是 一 样 的 。 在 Pen 中 ， 你 
可 以 通过 $! 急 得 到 。 但 如 果 使 用 die 来 表明 错误 ， 但 此 错误 不 是 系统 请 求 失 败 引起 的 ， 则 不 要 使 用 $!， 因 为 其 包含 的 信息 和 
实际 的 问题 无 关 。 它 所 包含 的 信息 ， 仅 对 系统 请 求 失败 时 有 效 。 






























































人 在 某 些 non-Unix 系统 中 ，$! 可 能 还 有 error number 7 一 类 的 信息 ， 你 需要 查阅 文档 才能 知道 其 具体 的 涵义 。 在 Windows 或 者 VMS 中 ， 
变量 $^E 还 有 额外 的 诊断 信息 。 























局 | 
































die 还 会 为 你 做 一 件 事 : 他 会 自动 将 Perl 程序 的 名 字 和 行 数 争 输 出 在 消息 的 末尾 ， 因 此 能 轻易 的 辨别 出 是 哪 一 个 die 引起 的 
昔 误 。 上 述 代码 如 果 含有 权限 不 够 (permission denieg 的 错误 ， 则 其 消息 如 下 : 




















刍 当 读 文 件 是 发 生 了 错误 ， 错 误 信息 将 包含 此 文件 的 “chunk number"”( 通 常 是 行 数 ) 和 文件 句柄 的 名 字 ， 因 为 一 般 它们 对 跟踪 bug 有 用 。 




















Cannot create logfile: permission denied at your_program line 1234. 














它们 是 有 帮助 的 ， 能 告诉 你 更 多 的 关于 错误 信息 。 如 果 不 想 要 函数 和 文件 的 名 字 ， 只 需 在 die 消息 后 面 加 上 换行 符 。 下 面 
是 另 一 种 使 用 die 的 方法 : 
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CQ@ARGVYV <2){ 
die“ Not enough arguments\n 


} 


如 果 命 令 行 中 的 参数 少 于 2 个 ， 上 述 程序 将 打印 出 此 错误 并 退出 。 他 不 会 打印 出 程序 的 名 字 和 程序 出 错 的 行 号 ， 这 些 信息 
对 用 户 是 没有 用 的 ;毕竟 这 是 用 户 的 错误 。 作 为 一 般 规 则 ， 如 果 用 法 错误 则 在 消息 后 面 加 上 换行 符 ， 如 果 是 其 它 错误 ， 需 
要 利用 它 来 调试 ， 则 不 要 加 上 换行 符合 。 


















































急 程 序 的 名 字 在 Perl 的 特殊 变量 $0 中 ， 因 此 你 可 能 将 它 包 含 在 : “$0:Not enough argumentsm”。 这 对 于 在 管道 中 的 程序 或 者 shell 脚本 是 非 
常 有 用 的 。 因 为 : $0 在 程序 运行 时 不 断 的 变化 。 你 可 以 查看 __FILE _ 和 _ _LINE__ (或 者 caller 函数 ) 来 了 解 被 加 上 换行 符 后 忽略 的 
信息 ， 从 而 可 以 按 你 自己 的 格式 输出 它们 。 






















































































你 应 当 检测 open 的 返回 值 ， 因 为 程序 的 剩余 部 分 依赖 于 是 否 成 功 的 打开 它 。 

















5. 8. 1 警告 信息 和 warn 








如 die 函数 可 以 指定 某 个 严重 错误 ， 就 像 Pen 的 内 峰 错 误 一 样 〈 如 除数 为 0)。 也 可 以 使 用 warn 函数 来 产生 警告 信息 ， 就 像 
Perl 内 扰 的 警告 一 样 〈 当 需要 其 是 defined 的 ， 但 使 用 了 undef 的 值 )。 



































warn 数 像 die 那样 工作 ， 除 了 最 后 一 步 ， 它 不 会 从 程序 中 退出 。 它 也 能 加 上 程序 的 名 字 和 行 号 ， 并 把 消息 输出 到 标准 错 
误 那 里 (standard errom ， 和 die 一 样 银 。 

















急 和 警告 (warnings) 不 能 通过 eval 来 捕捉 ， 但 严重 错误 (fatal erron 可 以 。 但 可 以 在 __warning_ _ 〈 在 perlvar 的 帮助 手册 中 有 ) 中 找到 。 




















谈论 完 die 和 warning 后 ， 我 们 继续 讨论 正常 的 IZ0。 





5.， 9 使 用 文件 句柄 


当 某 个 文件 句柄 被 打开 进行 输入 时 ， 可 以 像 从 STDIN 中 输入 一 样 。 例 如 ， 读 入 Unix 中 的 密码 文件 : 




















it(! open PASSWD，'/etc/pasSwd){ 
die "How did you get logged in2($1)”; 
} 
while(<PASSWD>){ 


chomp; 


在 本 例 中 ，die 后 面 的 消息 使 用 了 $!。 它 被 括号 括 起 来 了 。 如 你 所 知 的 ，“ 行 输入 操作 dine-input operatonD” 由 两 部 分 组 成 ; 
尖 括 号 (<>， 真 正 的 行 输入 操作 (line-input operator)) 和 人 尖 括 号 中 的 文件 句柄 。 












































写 出 @) 或 追加 的 C>) 的 文件 句柄 ， 可 以 和 print 或 printf 结合 使 用 ， 如 ; 
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print LOG “Captain's log, stardate 3.14159\m” # 输 出 到 LOG 中 
printf STDERR “%D percent complete.\n”, $done/$total * 100; 














注意 到 文件 句柄 和 要 打印 的 内 容 之 间 没 有 逗号 了 吗 争 ? 如 果 使 用 括号 ， 看 起 来 会 非常 古怪 。 下 面 的 两 种 写法 都 是 正确 的 : 


























合 如 果 你 英语 或 者 语言 学 方面 的 成 绩 是 A， 当 我 们 说 这 是 “间接 对 象 语法 (indirect object syntao”， 你 可 能 说 :“ 是 的 ， 当 然 我 知道 文件 句柄 
后 面 为 什么 没有 括号 ， 因 为 它 是 一 个 间接 对 象 indirect objecb”。 我 没有 得 到 A， 因 此 我 不 知道 为 什么 这 里 不 用 有 喜 号 ， 但 我 们 不 关心 它 
因为 Larry 告诉 我 们 这 样 做 。 
































printf (SITDERR“%d percent complete.m”, $done/$total * 100); 
printf STDERR (9%d percent complete.m”, $done/$total * 100); 


5. 9. 1 改变 默认 的 输出 句柄 








夫 认 情况 下 ， 如 果 不 指定 文件 句柄 给 print( 或 者 printf, 这 里 的 内 容 对 两 者 均 适 用 )， 则 默认 会 使 用 STDOUT。 但 这 个 默认 属 
性 ， 可 以 通过 select 操作 进行 更 改 。 如 下 ; 


select BEDROCK; 
print "TIhope ML Slate doesn't find out about this\n 
print “WilmalNn ; 














一 旦 选择 了 (selecb 了 某 个 文件 句柄 ， 则 它 将 变 成 默认 值 。 但 这 通常 是 一 个 坏 主意 ， 因 为 会 扰乱 程序 的 剩余 部 分 ， 因 此 在 完 
成 时 应 当 恢 复 以 前 的 设置 争 。 默 认 情 况 ， 输 出 到 文件 句柄 的 内 容 会 被 缓存 起 来 。 将 变量 4 设置 为 1 ， 将 会 在 输出 操作 结束 
会 立刻 清空 文件 句柄 。 如 果 想 确保 logfile 能 立刻 得 到 消息 ， 以 便 能 观察 程序 的 运行 情况 ， 可 以 使 用 下 面 的 程序 ; 




































































多 在 少数 情况 下 ，STDOUT 不 是 默认 的 文件 句柄 ， 可 以 在 perlfunc 的 帮助 手册 中 找到 相关 的 设置 和 重 置信 息 。 虽 然 已 经 告诉 你 了 相关 的 帮助 
手册 ， 还 有 一 点 需要 说 的 是 : Perl 有 两 个 内 符 的 select 函数 ， 均 可 在 perlfunc 的 帮助 手册 中 找到 。 另 一 个 select 函数 有 四 参数 ， 因 此 有 时 
被 称 为 “四 参数 的 select” 






































Select LOG; 

NE 王 二 了 #don't keep LOG entries sitting in the bufter 
Select STDOUT, 

#..time passes, babies learn to work, tectonic plates Shift, and then .…. 

print LOG “This gets written to the LOG at onceNn ; 


s. 10 重新 打开 文件 句柄 


我 们 早期 提 到 过 ， 如 果 重 新 打开 一 个 文件 句柄 〈 例 如 ， 打 开 一 个 文件 句柄 FRED， 但 之 前 已 经 打开 了 一 个 名 为 FRED 的 名 
柄 )， 前 一 个 句柄 将 被 自动 关闭 。 我 们 也 说 过 不 能 重用 六 种 标准 的 文件 句柄 ， 除 非 想 利用 其 特殊 的 性 质 。 我 们 还 说 过 die 和 
wamn 产生 的 信息 ， 以 及 Petl 内 部 产生 的 提示 (complaints) 信 息 将 自动 传 到 STDERR 上 。 如 果 把 这 三 条 信息 结合 起 来 看 ， 你 
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就 知道 怎样 把 错误 信息 传 给 文 
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件 ， 而 非 标准 错误 流 镶 : 














争 不 要 轻易 这 样 使 用 。 通 常 让 用 户 在 调 入 程序 时 设置 而 非 在 代码 中 写 死 更 好 。 但 是 ， 如 果 程 序 由 其 它 程序 运行 ， 则 使 用 这 种 方法 将 非常 方 

















便 ( 例 如 ，web 服务 器 ， 或 者 调度 程序 如 :cron，at)。 另 一 个 












































是 你 的 程序 可 能 启动 一 个 新 的 进程 

















你 希望 它们 有 不 同 的 IO 连接 。 





# 尾 出 错 信息 送 到 私有 错误 日 志 上 
ii(! Open SITDERR,，“>>/home/barney/.error log ”){ 


die“Can't open error log for append: $!”; 


} 














有 打开 ， 会 出 现 什么 情况 呢 ? 








答案 是 ， 如 果 系 统 的 三 个 句柄 























STDIN, STDOUT STDERR 重新 打开 时 没有 成 功 ，Pezl 会 自动 使 用 前 一 个 争 。 也 就 是 说 ， 只 














有 Perl 成 功 的 








新 打开 新 的 连接 ， 和 否则 是 不 会 关闭 以 前 的 连接 。 





急 至 少 ， 如 果 没 有 改变 Perl 变量 $^F， 这 是 正确 的 。 如 果 修 改 了 ， 结 果 就 不 定 了 。 





S. 1 练习 





附录 A 中 有 下 列 习题 的 答案 : 























1. [7] 写 一 个 程序 ， 类 似 于 cat， 但 保持 输出 的 顺序 关系 。( 某 些 系统 的 名 字 可 能 是 tac。) 如 
betty， 输 出 将 是 文件 petp 的 内 容 ， 从 最 后 一 行 到 第 一 行 ， 然 后 是 parnrey 最 后 是 ,jed 同样 是 从 最 后 一 行 到 第 一 行 。( 注 意 























使 用 ./ 确 保 调用 的 是 你 自己 的 
































程序 ， 而 非 系统 提供 的 ) 





2. [8] 写 一 个 程序 ， 要 求 用 户 在 不 同 的 行 中 输入 一 些 字 符 串 ， 将 此 字符 串 打印 出 来 ， 规 则 是 
在 开头 打印 出 一 串 数 字 作 为 比较 〈 帮 助 调试 )。 注 意 ， 不 要 犯 19 个 字符 宽度 的 错误 。 例 如 ， 
如 果 输 入 ，hello, good-bye， 则 输出 为 : 





对 齐 。 为 了 确保 正确 的 输出 ， 





1234507890123456789012345 
hello 
good-bye 


3. [8] 修 改 上 一 个 程序 ， 允 许 有 




















07890123450789012345678901234567890 





户 选 择 宽度 ， 如 ， 用 户 输入 30，hello, good-bye( 在 不 同 的 行 


示 : 参阅 第 二 童 相应 部 分 )。 提 示 ， 如 果 选 择 的 宽度 大 长 ， 可 以 增加 比较 行 的 长 度 。 
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如 system，exec， 在 第 十 四 章 介绍 )， 











新 打开 STDERR 时 ，Perl 中 的 任何 错误 信息 将 被 写 入 新 的 文件 。 但 如 果 执 行 了 die 语 多， 并且 接收 错误 消息 的 文件 没 











果 运 行 此 程序 : ./tac fred barmey 





: 每 一 条 占 20 个 字符 宽度 ， 碳 





P)， 则 每 一 行 的 宽度 为 30。( 提 
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第 六 章 哈 和 希 






































本 章 ， 你 将 看 到 使 Perl 成 为 主流 程序 语言 的 功能 - 哈 希 (hash) 争 。 虽 然 哈 希 是 一 种 非常 有 效 的 功能 , 但 许多 语言 并 没有 提供 。 
当 你 学 过 哈 希 之 后 ， 几 乎 在 你 的 每 一 个 程序 中 都 会 使 用 到 它 ， 因为 它 是 如 此 重要 。 
























































人 早期 ， 我 们 把 它 叫做 “关联 数组 (associative arrays)”。Perl 组 织 认为 它 难于 书写 和 阅读 ， 因 此 改名 为 “ 哈 希 hashes) ”. 








6. 工件 么 是 哈 希 ? 


























哈 希 是 一 种 数据 结构 ， 和 数组 类 似 ， 可 以 将 值 存放 到 其 中 ， 或 者 从 中 取 回 值 。 但 是 ， 和 数组 不 同 的 是 ， 其 索引 不 是 数字 ， 
而 是 名 字 。 也 就 是 说 ， 索 引 〈 这 里 ， 我 们 将 它 叫 key) 不 是 数字 而 是 任意 的 唯一 的 字符 串 〈 参 见 图 6-1 )。 


















































这 些 keys 是 字符 串 ， 因 此 当 从 中 取 值 时 不 是 使 用 如 数字 3， 而 是 使 用 此 hash 元 素 的 名 字 wilma。 









































这 些 keys 可 以 是 任意 的 字符 串 ， 你 可 以 使 用 任何 的 字符 串 作 为 key。 人 但， 它们 是 唯一 的 ， 就 像 数 组 中 只 有 一 个 元 素 的 索引 
是 3， 这 里 也 只 有 一 个 hash 元 素 的 名 字 为 wilma。 














另 一 种 思考 hash 的 方法 是 ， 把 它 看 作 一 堆 数 据 〈a barrel of data) (参见 图 6-2)， 每 一 个 数据 都 有 一 个 相应 的 标签 。 可 以 通 
过 标签 访问 此 标签 对 应 的 元 素 。 但 其 中 是 没有 “第 一 个 ”元 素 的 概念 的 。 在 数组 中 ， 数 组 元 素 从 0,12 开始 编号 。 但 在 hash 
中 ， 没 有 确定 的 顺序 ， 因 此 也 没有 第 一 个 元 素 。 只 是 一 些 key/value 对 的 集合 。 
















































































图 6-1 哈 希 的 keys 和 values 

















values 
“foo” 33 
“bar” 12.4 
ks [2 “hello” 
“Wilma” 1.72e30 
“betty” “bye\n” 

















图 6-2 一 堆 数 据 的 hash 
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keys 和 values 均 为 任意 的 标量 ， 但 keys 通常 转换 为 字符 串 。 因 此 ， 如 果 将 表达 式 50/20 作为 keys 急 ， 则 其 通常 被 转换 为 3 
字符 的 字符 串 “2.3"。 这 是 上 图 中 的 一 个 key。 
































急 此 处 为 数字 表达 式 ， 而 非 5 个 字符 的 字符 串 “50/20"。 如 果 我 们 将 上 述 5 个 字符 的 字符 串 作 为 hash 的 key， 则 其 不 会 被 转变 。 











通常 ， 由 于 Perl 的 “没有 不 必要 的 限制 ”的 设计 哲学 : hash 可 以 是 任意 大 小 ， 从 空 hash( 没 有 key/value 对 )， 到 任何 你 内 存 
允许 的 大 小 。 








某 些 实现 了 hash 的 语言 《如 早期 的 aowk 语言 ，Larry 从 中 借鉴 了 hash)， 当 hashes 变 大 时 ， 速 度 会 变 慢 。Perl 中 不 会 有 这 种 
， 因 为 它 有 一 个 优秀 的 算法 争 。 因 此 ， 如 果 Perl 只 有 3 个 key/value 对 ， 它 的 速度 很 快 。 当 拥有 3 百 万 key/value 对 时 ， 


度 仍 非常 快 。 大 的 hash 表 ， 对 性 能 不 会 有 什么 影响 。 








些 
问题 
其 速 





























急 技 术 上 讲 ， 当 hashes 很 大 时 ，Perl 会 根据 需要 而 重建 hash。“hashes” 这 个 名 词 的 来 源 即 是 由 于 使 用 了 hash 表 来 实现 它 。 























keys 是 唯一 的 ， 但 values 可 以 重复 。hash 的 value 可 以 是 数字 ， 字 符 串 ，undef， 或 者 它们 的 混合 争 ， 但 key 是 唯一 的 。 





急事 实 上 ， 任 意 的 标量 值 ， 包 括 我 们 没有 在 本 书 见 过 的 标量 类 型 。 








6. 1. 1 为 什么 使 用 Hash? 








当 第 一 次 听 说 hashes， 特 别 是 如 果 以 前 使 用 过 某 种 不 含 hash 的 程序 语言 仍然 高 产 时 ， 你 可 能 猜想 为 什么 有 人 要 发 明 这 种 奇 
怪 的 东西 呢 ? 通常 的 理由 是 ， 有 一 类 问题 是 ， 某 个 数据 集 和 别 的 数据 集 的 关系 的 问题 。 例 如 ， 下 面 是 一 些 例子 : 
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Cive1z 11G11e, JJ1020y 11G111e 








Givemn na11e〈 名 ) 是 key，joampipy naze〈 姓 ) 为 value。 这 需要 given mames( 名 ) 是 唯一 的 ， 如 果 有 了 两 人 均 叫 做 ranrda1， 这 将 引 
起 问题 。 使 用 hash,， 你 可 以 通过 查看 任何 人 的 given mame, 而 找到 其 对 应 的 .raitpy name。 如果 使 用 key: iom， 将 得 到 value: 


PHoe1ix。 



































已 os1za11e, 7P adadresyy 





你 可 能 已 经 知道 ， 因 特 网 上 每 一 台 主 机 都 有 一 个 主机 名 “〈 如 www.stonehence.com) 和 一 个 卫 地 址 (如 123.45.67.89 )， 因 为 
机 器 更 擅长 处 理 数 字 ， 但 对 人 而 言 ， 名 字 更 容易 记忆 。 主 机 名 是 唯一 的 ， 因 此 可 以 将 其 作为 key。 在 这 种 hash 中 ， 我 们 可 
以 通过 查询 主机 名 而 找到 其 对 应 的 王 地 址 。 



































1Paddqdreys, pos11a111e 








你 也 可 以 按 相 反 的 顺序 来 处 理 。 通 常 我 们 把 下 地 址 看 作 数 字 ， 它 也 是 唯一 的 字符 串 ， 因 此 也 可 以 作为 hash 的 key。 在 这 种 
hash 中 ， 我 们 可 以 通过 查询 下 地 址 来 查找 对 应 的 主机 名 。 这 和 上 一 例 中 的 hash 是 不 同 的 : hash 是 单 向 的 ， 由 key 到 value; 
没有 通过 查询 value 来 得 到 其 key 方法。 因此， 上述 hashes 可 以 看 作 一 对 hash， 一 个 针对 下 adaresses(GP 地 址 )， 一 个 针对 
jpos1zaamtes( 主 机 名 )。 从 一 个 hash 表 得 到 其 对 应 的 hash 表 是 很 容易 的 ， 这 在 后 面 将 了 解 到 。 



























































f 同 双 cornt ofmzaper offipresy 1Patworad appears( 此 尊 幼 现 的 次 数 ) 





这 是 hash 的 一 种 币 用 用 法 。 它 使 用 的 如 此 普遍 ， 因 此 ， 我 们 在 本 章 中 有 一 个 相应 的 练习 。 














这 里 的 想法 是 ， 你 可 能 希望 知道 某 个 文件 中 单词 出 现 的 次 数 。 也 许 在 给 一 些 文档 编 索 引 ， 当 用 户 查 询 fred 时 ， 将 知道 基 个 
文件 提 到 fred 5 次 ， 另 一 份 文档 提 到 fred 7 次 ， 第 三 份 文 档 没 有 出 现 fred 等 等 。 索 引 的 结果 将 告诉 用 户 那 一 份 文档 是 其 所 
希望 的 。 当 编制 此 索引 的 程序 读 入 某 个 文档 时 ， 每 当 遇 到 fred， 此 文档 对 应 fred 的 value 就 增 1。 也 就 是 说 ， 如 果 某 份 文档 
中 fred 已 经 出 现 了 2 次， 其 value 为 2， 当 又 发 现时 fred， 其 value 增 到 3。 如 果 以 前 没有 找到 fred， 则 其 value 从 undef( 默 
认 值 ) 变 为 1。 








































































































Csernaa1ae, tper ofdisk biockes 1Pey are USingjwastigj( 肥 做 历 〔 厦 有 历 ) 鸭 太 毒 撩 产 ) 

















系统 管理 员 喜 欢 这 种 应 用 。 某 个 系统 中 的 wsemaames 〈 用 户 名 ) 是 唯一 的 ， 因 此 可 以 把 它们 作为 hash 的 keys ， 我 们 可 以 查 
询 它 了 解 到 此 用 户 的 信息 。 




















D1ivers Lice1ye 1211De7 11G111e 














可 能 有 许多 人 叫做 John Smith， 但 每 一 个 人 有 一 个 不 同 的 欧 殊 证 编 贫 drivery 1icense Paper)。 这 个 编号 是 唯一 的 ， 可 以 作 
为 key， 对 应 的 名 字 为 value。 














还 可 以 把 hash 看 作 一 个 简单 的 数据 库 ， 其 中 每 一 个 key 下 面 可 以 有 一 块 数据 。 如 果 你 的 任务 是 关于 : “查询 重复 的 >,“ 唯 
一 的 “交叉 引用 的 ”%“ 碍 询 表 ” 则 hash 很 可 能 在 这 类 应 用 中 帮 上 你 的 忙 。 
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6，2 哈 希 元 素 的 存 取 


要 访问 hash 元 素 ， 可 以 使 用 下 面 的 语法 : 
$hash{$some_key} 


这 和 访问 数组 元 素 的 方法 有 些 类 似 ， 这 里 下 标 (key) 上 使 用 的 是 花 括 号 (())， 而 不 是 方 括号 〈[]) 争 。 现 在 key 的 表达 式 是 字 
符 串 ， 而 非 数字 : 























急 这 里 我 们 可 以 宕 探 到 Larry Wall 的 设计 思想 : Larry 认为 由 于 其 和 普通 数组 不 同 ， 则 也 应 当 使 用 和 普通 数组 不 同 的 符号 。 

















$family_nameffred”) = “flntstone”; 


$family_name{barney} = “Tubble”; 


图 6-3 显示 了 和 上 例 对 应 的 图 表 。 


6-3 给 hash 的 keys 赋值 





我 们 如 下 的 书写 代码 : 


foreach $person (qw<barney fred>){ 


print “Tve heard of $person $family_name{f$person jn”; 











hash 的 名 字 和 Perl 中 其 它 的 标识 符 的 命名 规则 是 一 样 的 《字母 ， 数 字 ， 下 划 线 组 成 ， 但 不 能 由 数字 开头 )。 由 于 其 属于 不 
同 的 名 字 空 间 ， 则 像 hash 元 素 $family_nameffred"} 和 子 程序 &family_name 之 间 没 有 任何 的 关系 。 当 然 ， 没 有 理由 将 它们 
命名 成 一 样 的 ， 这 会 让 读者 困惑 。 但 Perl 本 身 并 不 关心 ， 你 是 否 将 某 个 变量 叫做 $family_name, 某 个 数组 元 素 称 为 
$family_name[5] 等 。 但 人 们 通常 不 习惯 ， 通 过 名 字 前 面 或 者 后 面 的 符号 来 判断 其 具体 的 含义 ， 虽 然 Perl 是 这 样 做 的 。 当 在 
名 字 前 面 是 美元 符号 (9 和， 后面 是 花 括 号 ())， 则 其 为 hash 元 素 。 


























当 给 hash 选择 名 字 时 ， 最 好 这 样 思考 : hash 元 素 的 名 字 和 key 之 间 可 以 用 for 来 连接 。 如 , “the family_name for fred is 
flintstone(fred 的 姓 是 fliintstone)”。 因 此 ，hash 名 为 family_name， 现 在 keys 和 values 之 间 的 关系 就 相当 清楚 了 。 


Hash 的 key 可 以 是 任意 的 表达 式 : 
$foo = “bar”， 
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print $family_name{f$ftoo “ney”};  # 输 出 “rubble” 


当 将 某 个 值 存储 在 已 经 存在 的 hash 元 素 中 ， 以 前 的 值 会 被 覆盖 ; 





$family_namef{' fred”} =“astaire”; # 将 新 值 赋 给 已 经 存在 的 元 素 
$bedrock = $family_namef{'fred”}; # 得 到 “astaire”;， 以 前 的 值 丢 失 了 








这 和 数组 或 标量 变量 中 的 情况 是 一 样 的 。 如 果 存 放 一 个 新 值 到 $pebbles[17] 或 $dino 中 ， 则 以 前 的 值 被 奉 换 。 如 果 将 新 值 存 
在 $family_namef “fred”} 中 ， 则 以 前 的 值 同 样 被 替换 掉 。 





























可 以 通过 赋值 语句 对 hash 元 素 赋 值 : 














$ftamily_name{ewilma”} = “flintstone”; # 新 增 一 个 key( 也 包括 value) 
$family_name{“betty”}] .= $family_name{“barney”};  # 创 建 一 个 新 元 素 








这 和 数组 或 标量 中 的 情形 是 一 样 的 :如 果 以 前 没有 $pebbles[17] 和 $dino ,赋值 后 就 有 了 。 如 果 以 前 没有 $family_name{“betty”}， 
则 情况 是 一 样 的 。 








访问 不 存在 的 hash 元 素 得 到 undef: 





$grantie = $family_name{”“larry”}; # 没 有 larry: 得 到 undef 


这 同样 和 数组 或 标量 中 的 情形 类 似 ; 如 果 $pebbles[17] 和 $dino 中 没有 值 ， 则 访问 它们 得 到 的 结果 为 undef。 如 果 
$family_namef{“larry“} 中 没有 存放 值 ， 则 其 返回 undef。 
































6. 2. 1 作为 整体 的 hash 











要 引用 整个 hash， 使 用 百 分 号 (“9% 站 作为 前 缀 。 前 面 几 页 中 使 用 的 hash 的 名 字 为 %family_name。 








为 了 方便 ，hash 可 以 转换 为 列表 ， 或 者 反 过 来 。 给 hash 赋值 《本 例 中 ， 参 见 图 6-1) 其 类 型 属于 列表 context 赋值 ， 其 中 列 
表 是 key/value 对 争 : 



































急 虽 然 可 以 使 用 任何 列表 表达 式 ， 但 其 元 素 个 数 必须 是 偶数 ， 因 为 由 key/value 对 组 成 。 元 素 个 数 为 奇数 是 不 可 靠 的 ， 这 通常 会 引起 警告 。 


























%Some_hash =( foo 33，bar , 12.4, 2.35，hello "willma 1.72e30，“betty byeNm); 








hash 的 值 〈 在 列表 context 中 ) 是 一 个 key/value 对 的 列表 : 

















Q@array_array = %Ssome_hash; 











我 们 把 这 称 为 : 将 hash 展开 ， 并 将 其 key/value 对 返回 到 一 个 列表 中 。 返 回 的 key/value 顺序 和 存放 的 顺序 可 能 不 同 : 





Print“@any_array\n ; 
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# 可 能 得 到 如 下 的 结果 : betty bye( 换 行 )，wilma 1.72e+30 foo 35 2.5 hello bar 12.4 





























上 述 顺 序 看 起 来 很 混乱 ， 但 对 Pezl 来 讲 很 方便 ， 这 种 顺序 Perl 查询 起 来 特别 快 。 一 般 使 用 hash 时 并 不 关心 其 实际 的 顺序 ， 
或 者 有 某 种 简单 的 方法 将 它们 按 要 求 的 顺序 排序 。 



































虽然 key/value 对 的 顺序 是 杂乱 的 ， 但 返回 的 列表 中 每 一 个 key 和 其 value 是 连 在 一 起 的 。 因 此 ， 虽 然 我 们 不 知道 key: foo 
会 出 现在 什么 地 方 ， 但 我 们 知道 其 value: 35 会 紧 随 其 后 。 


























6. 2. 2 Hash 赋值 





很 少 这 样 做 ， 但 可 以 使 用 如 下 的 语法 在 hash 之 间 找 贝 : 


5%onew_hash = %old_hash; 





这 种 运算 ，Perl 实际 做 的 运算 比 想 象 的 要 多 。 不 像 Pascal 或 者 C 语言 ， 这 种 操作 通常 是 找 贝 一 块 内 存 。Perl 的 数据 结构 更 
加 复杂 。 这 段 代码 告诉 Perl 将 %old_hash 展开 成 key/value 的 列表 ， 再 将 其 赋 给 %new_hash， 其 将 key/value 对 一 个 一 个 加 入 
的 。 



































将 hash 转变 成 其 它 形式 更 加 第 见 。 例 如 ， 我 们 可 以 将 hash 反 转 : 


%inverse_hash = reverse %any_hash; 














这 会 将 %any_hash 展开 成 key/value 对 的 列表 ， 其 列表 如 〈keyyalue,keyyalue,Kieyyalue………)。 然 后 ， 将 其 反 转 ， 得 到 

Cyalue,Kemyalue,Keyyalue,Key )。value 和 key 的 位 置 交 换 了 。 当 将 其 存放 在 %inverse_hash ， 我 们 就 可 以 查询 对 于 
%any_hash 来 说 是 value 的 字符 串 ， 因 为 现在 它 对 于 %inverse_hash 来 讲 是 key 了 。 查 询 到 的 value 对 于 %any_hash 来 讲 属 于 
key。 这 给 我 们 提供 了 一 种 方法 : 查询 “value”( 现在 成 了 key)， 得 到 “key"( 现 在 成 了 value)。 









































你 可 能 猜测 《按照 科学 的 方法 ， 如 果 你 足够 聪明 ) 这 仅 当 值 也 是 唯一 的 情况 才能 正常 工作 。 和 否则 ， 我 们 将 得 到 重复 的 key， 
且 key 必须 是 唯一 的 。 这 里 有 一 条 规则 : 最 后 一 次 赋值 获胜 。 也 就 是 说 ， 列 表 中 后 面 的 元 素 将 履 盖 掉 以 前 的 元 素 (相同 key 
时 ?。 由 于 我 们 并 不 知道 key/value 对 的 顺序 ， 因 此 也 不 能 判断 哪 一 对 将 最 终 获胜 〈 被 使 用 )。 如 果 想 使 用 这 种 技术 ， 那 你 必 
须 确 保 之 前 的 值 是 唯一 的 争 。 如 我 们 在 早期 的 忆 address 和 postnaarmze 的 例子 中 就 可 以 使 用 : 























一 、 
















































































急 或 者 你 并 不 关心 重复 的 情况 。 例 如 ， 反 转 %family_name(keys 为 given name (名 ) , 而 value 为 family names ( 姓 ) ) 将 很 容易 判断 是 否 存在 此 
family name。 例 如 ， 在 反 转 的 hash 中 ， 如 果 没 有 key: slate， 那 我 们 就 能 确定 在 最 初 的 hash 中 没有 family name: slate。 











%ip_address = Teverse 9%ohost_name; 


我 们 可 以 查询 耳 地 址 ， 或 者 主机 名 来 得 到 其 对 应 的 主机 名 或 者 耳 地 址 。 
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6. 2. 3 大 箭头 符号 (=> ) 














当 给 hash 赋值 时 ， 有 时 并 不 明显 哪些 元 素 是 keys， 那 些 是 values。 例 如 ， 在 下 面 的 赋值 中 〈 我 们 在 前 面 已 经 见 过 了 )， 我 
门 需 要 仔细 的 计数 ,，“Keyyvalue'keyyvalue,.…”"; 来 判断 2.5 是 key 还 是 vlaue: 
























































ws 


%Some_hash = ( “ foo” 33，“bar , 12.4 ,2.3，hello “Wilma 1.72e30，“betty ”byevn ); 





如 果 Perl 能 提供 一 种 方法 ， 让 我 们 轻易 的 辨别 出 哪 一 个 是 key， 哪 一 个 是 value， 那 该 有 多 好 ? Larry 也 想 过 这 个 问题 ， 因 
此 发 明了 大 箭头 符号 (=>) 争 。 对 于 Perl 来 讲 ， 其 作用 和 和 逗号 〈, ) 类 似 ， 因 此 有 时 称 作 “ 胖 运 号 (fat comma)”。Perl 语法 
中 ， 在 需要 逗号 〈, ) 的 时 候 ， 都 可 以 使 用 大 箭头 符号 替换 ， 对 于 Pell 来 讲 ， 它 们 是 一 样 的 $$。 下 面 是 给 hash 赋值 的 另 一 
种 方法 : 











银 是 的 ， 还 有 小 箭头 〈 一 >)。 它 和 引用 一 起 使 用 ， 这 是 高 级 话题 。 如 果 你 准备 好 了 ， 可 以 参见 perlreftut 和 perlref 的 帮助 手册 





















































争 它 们 在 技术 上 还 是 有 一 点 不 同 : 任何 大 箭头 符号 (=>) 左 侧 的 bareword〈 由 字母 ， 数 字 ， 下 划 线 ， 但 不 是 由 数字 开头 ， 前 面 有 可 选 的 
加 号 或 减 号 , 组 成 的 序列 ) 都 暗含 着 由 引号 括 起 来 了 的 。 因 此 可 以 省 略 掉 大 箭头 符号 (=>) 左 侧 bareword 上 的 引号 。 你 也 可 以 忽略 掉 hash 
的 花 括号 中 的 引号 ， 如 果 里 面具 有 作为 key 的 bareword. 











































































































| 也 








Imy %last_name = ( 
“fred” => “flntstone”， 
“dino” => undef， 
“barney => “Tubble”; 
“betty”=> “Tubble ， 




































































关 

上 面 代码 中 ， 很 容易 辨别 出 哪 一 个 是 key， 哪 一 个 是 value。 注 意 列 表 中 最 后 一 个 逗号 。 我 们 早期 讨论 过 ， 这 个 喜 号 是 没 什 
么 用 的 ， 但 有 时 能 给 我 们 带 来 方便 ， 如 果 我 们 要 加 入 新 的 元 素 到 hash 中 ， 我 们 只 需 知道 每 一 行 都 有 key/value 对 ， 结 尾 有 
喜 号 。Perl 会 查看 不 同 元 素 之 间 的 喜 号 ， 以 及 列表 结尾 处 的 运 号 〈 此 喜 号 非 必需 的 )。 





6. 3 哈 希 函数 


某 些 有 用 的 函数 可 以 对 整个 hash 进行 操作 。 





6. 3. 1 keys 和 values 函数 





keys 函数 会 返回 此 hash 的 所 有 keys，values 函数 将 返回 所 有 的 values。 如 果 hash 中 没有 元 素 ， 则 此 函数 将 返回 空 列表 : 


iy %hash 三 (2 = 三 > D = 三 >2C =>3); 
my @Kk = keys %hash，; 
my Q@v = values %hash; 


blei@ 163.com 87/201 9/21/2006 


Perl 语言 入 门 (第 四 版 ) 











也 


现在 ，@K 含有 “ab” “2 而 @v 含 有 1,2,3， 其 顺序 可 能 不 同 。 记 住 ，Perl 并 不 维护 hash 中 元 素 的 顺序 。 但 ， 其 中 keys 
按照 某 种 顺序 存储 ， 则 其 对 应 的 values 也 是 这 个 顺序 : 如 果 ”b" 排 在 keys 的 最 后 ， 则 2 也 排 在 values 的 最 后 。 如 果 “c" 是 
第 一 个 则 3 也 是 第 一 个 。 这 种 论断 是 正确 的 ， 如 果 没 有 对 keys 或 values 做 什么 修改 。 如 果 添 加 了 新 元 素 到 hash 中 ，Perl 
会 重新 对 它们 进行 排序 ， 以 便 能 更 快速 的 访问 它们 。 在 标量 context 中 ， 这 些 函数 返回 hash 中 元 素 的 个 数 (key/value)。 此 
类 操作 不 需要 访问 hash 的 每 一 个 元 素 ， 其 效率 是 很 高 的 : 

my $count = keys %hash; # 得 到 3， 是 指 有 3 个 key/value 对 























































































































有 时 ， 你 可 能 看 到 有 人 将 hash 作为 boolean(true/false) 表 达 式 来 使 用 : 








这 (9ohasp){ 
Print “That was atrue valueWNn ; 


} 














L 




















上 述 语句 为 true， 当 且 仅 当 
做 。 





至 少 含 有 一 个 key/value 对 争 。 一 般 ， 上 述 语句 是 说 ,“ 如 果 hash 非 空 ….” 但 实际 中 很 少 这 样 








生 
TIT 








必 ， 对 于 调试 的 用 户 有 帮助 。 其 看 起 来 像 “4/16”， 但 true 或 者 false 是 由 hash 的 列表 是 否 为 空 决定 的 。 








争 其 返回 值 为 一 个 字 各 





























6. 3. 2 each 函数 























如 果 想 迭代 hash 的 每 一 个 元 素 如， 检查 每 一 个 元 素 )， 一 种 通常 的 方法 是 使 用 each 函数 ， 它 将 返回 key/value 对 的 2 元 素 
列表 争 。 当 对 同一 个 hash 函数 进行 一 次 友 代 时 ， 将 返回 下 一 个 key/value 对 ， 直 到 所 有 的 元 素 均 被 访问 。 如 果 没 有 更 多 的 
key/value 对 ， 则 each 函数 将 返回 空 表 。 






































急 另 一 种 方法 是 使 用 foreach， 这 将 在 本 节 末 尾 介 绍 。 




















实践 中 ， 一 般 只 在 while 循环 中 使 用 each; 


while (($key, $value) = each %ohash){ 
Print '“$key => $valueNm”; 





上 述 代 码 中 ， 首 先 ，each %hash 将 从 hash 中 返回 一 个 key/value 对 ; 假设 key 为 “c"，value 为 3 ， 则 列表 为 c”3)。 这 个 





























列表 赋 给 ($key, $value)， 现 在 $key 为 “”， 而 $value 为 3。 
但 上 述 赋值 语句 是 作为 while 循环 的 条 件 表达 式 ， 这 是 在 标量 context 中 。( 更 确切 的 说 ， 这 是 boolean context， 其 希望 得 到 








true/false 值 ， 但 boolean context 是 一 种 特殊 的 标量 context)。 列 表 赋 值 语 名 在 标量 context 中 返回 的 是 元 素 的 个 数 ， 在 本 例 
中 ， 是 2 。 由 于 2 是 一 个 true 值 ， 我 们 进入 循环 ， 然 后 输出 c=>3。 






























































第 二 次 进入 循环 时 ，each9%ohash 得 到 一 个 新 的 key/value 对 ， 例 如 ,返回 6a”,1D)。(CPerl 会 返回 一 个 不 同 的 key/value 对 ， 因 为 
Perl 能 对 其 追踪 。 按 照 行 话 来 讲 ， 每 一 个 hash 都 有 一 个 iterator ( 友 代 器 )。 争 ) 这 两 元 素 被 存放 在 ($key, $value) 中 。 由 于 元 
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素 个 数 也 为 2 ， 为 真 值 ， 则 进入 while 循环 ， 输 出 a=> 1。 




















急 由 于 每 一 个 hash 都 有 一 个 私有 的 返 代 器 (iterator)， 因 此 ， 使 用 each 的 循环 是 可 以 拒 套 的 ， 因 为 不 同 的 hash 有 不 同 的 欠 代 器 〈iterator)。 
虽然 这 只 是 脚注 ， 但 我 们 也 应 当 告 诉 你 ， 你 可 以 通过 使 用 keys 或 values 函数 ， 重 置 迁 代 器 〈iterator) 。 如 果 新 列表 加 入 到 此 hash 中 ， 或 
者 each 函数 迭代 到 最 后 一 个 元 素 ， 也 会 重 置 欠 代 器 〈iterator)。 另 一 方面 ， 如 果 在 欠 代 时 加 入 新 的 key/value 对 ， 通 常 是 一 个 坏 主 意 ， 这 
不 会 重 置 迭代 器 (iterator)。 但 很 可 能 混淆 你， 以 及 维护 人 员 。 

再 进行 一 次 循环 ， 得 到 结果 b=>2。 











































































































现在 没有 剩余 的 元 素 了 。 当 Perl 执行 each %hash, 由 于 没有 key/value 对 ,因此 返回 衬 列 表 。 空 列表 赋 给 ($key, $value)，$key 
得 到 undef, $value 仍然 为 undef。 


























急 由 于 是 在 列表 context 中 ， 其 返回 的 不 是 表明 失败 的 undef， 因 为 undef 是 一 个 元 素 的 列表 (undef) 而 零 元 素 非 空 列 表 ( )。 


























我 们 并 不 需要 关心 上 面 的 过 程 ， 因 为 它 是 作为 一 个 整体 在 while 循环 的 条 件 部 分 被 求 值 的 。 列 表 在 一 个 标量 context 中 将 返 
回 其 元 素 的 个 数 ， 在 本 例 中 ,为 0 。 由 于 0 时 false 值 ， 则 while 循环 结束 ， 执 行程 序 的 剩余 部 分 。 






































当然 ，each 返回 的 key/vlaue 对 ， 顺 序 是 混乱 的 〈 它 其 顺序 和 keys 和 values 函数 返回 的 顺序 相同 )。 如 果 想 将 其 按 序 排放 ， 
可 以 对 它们 排序 〈 使 用 sort)， 大 致 如 下 : 











foreach $key (Sort keys 9%ohasp){ 
$value =$hass{$key }; 
Print “$key => $valueNm”; 
# 也 可 以 不 使 用 额外 的 临时 变量 $value 
#print '“$key => $hash{keyj}\n”; 
} 














在 第 十 三 章 中 有 更 多 的 关于 对 hashes 进行 排序 的 介绍 。 














6 4 哈 硕 的 通常 用 法 


到 现在 为 止 ， 一 个 具体 的 例子 更 能 把 问题 说 清楚 。 























假设 一 个 叫做 Bedrock 的 图 书馆 使 用 Perl 程序 ， 其 中 有 一 个 hash 对 借阅 者 借 的 书 的 数量 进行 跟踪 : 











$books{f fred”} = 3; 
$books{ 和 wilma”} = 1; 








很 容易 知道 hash 的 某 个 元 素 是 true 还 是 falsge， 像 下 面 这 样 ; 


if($books{$someone }){ 
print “$someone has at least one book checked out. Nm”; 


} 
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hash 中 某 些 元 素 为 false: 


$books{“barney”} = 0; 朴 & 有 借 书 
$books{“pebbles”} = undef: # 从 没有 借 过 书 

















于 Pebbles 从 没有 结果 书 ， 因 此 其 值 为 undef， 而 非 0。 
对 于 每 个 拥有 借 书 卡 (library card) 的 人 都 有 一 个 key。 对 于 这 个 key， 其 对 应 的 value 是 其 借 书 的 数量 ， 如 果 从 没有 借 过 ， 其 
值 为 undef。 





















































6 4. 1 exists 函数 

















要 查看 hash 中 是 否 存在 某 个 key《〈 某 人 是 否 有 借 书 卡 )， 可 以 使 用 exisfs 函数 ， 如 果 hash 中 存在 此 key， 则 返回 true， 这 和 
是 否 有 对 应 的 value 无 关 : 

















if(exists $books{$dqino }){ 
Print “Hey, there'"s alibaray card for dinolm 


} 

















这 即 是 说 ， 当 且 仅 当 hash 中 《〈Kkeys % books) 的 keys 的 列表 中 存在 dino 时 ，exists $books{“dino 汪 ] 才 返回 true。 








6. 4. 2 delete 函数 


delete 函数 将 某 个 给 定 的 key〈 和 包括 其 对 应 的 value) 从 hash 中 删除 。( 如 果 不 存 在 这 个 key 则 什么 也 不 做 ; 不 会 有 和 警 


背 误 信息 。) 


他 
地 
让 











my $person = “betty”; 
delete $books{$personj; # 将 $person 的 借 书 卡 删除 掉 



































这 和 hash 中 存储 的 为 undef 是 不 同 的 。 使 用 exists($books{ “betty”)) 将 给 出 相反 的 结果 。 使 用 delete 后 ，hash 中 将 不 会 存在 
此 key; 如 果 其 值 是 udnef， 则 key 是 存在 的 。 















































本 例 中 ，delete 和 存储 的 值 为 undef 的 不 同 点 在 于 ， 前 者 是 将 Betty 的 借 书 卡 取 走 (删除 )， 而 后 者 是 给 她 一 张 从 没有 用 过 的 
背书 卡 。 








6. 4. 3 hash 元 素 的 内 插 














你 可 以 在 双 引 号 的 字符 串 中 使 用 单个 hash 元 素 : 








foreach $person (Sort keys 9%9books){ 
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这 $books{$person }){ 
print “$person has $books{$person} itemsm” #fred 有 3 个 


如 人 


但 不 支持 整个 hash 的 内 插 ; “%books" 仅 是 六 个 不 同 的 字符 %books 急 。 你 已 经 见 过 所 有 的 在 双 引 号 中 会 被 内 插 的 特殊 字符 : 
$ 和 @， 可 以 使 用 反 斜 线 q 得 到 这 样 的 字符 ， 和 否则 其 会 被 内 插 。 其 它 字符 都 不 会 别 内 插 ， 会 被 照常 输出 争 。 















































ES 


日 














急 如 果 将 整个 hash 按照 key/value 对 输出 出 来 ， 这 没有 什么 用 处 。 你 在 上 章 中 已 经 见 过 了 ， 百 分 号 〈 狗 ) 在 printt 中 经 常 作为 格式 输出 
符号 。 如 果 再 赋予 其 它 的 含义 ， 将 带 来 极 大 的 不 便 。 
































人 注意 双 引 号 中 抽 号 () 左 中 括号 (0), 小 箭头 (->), 双 冒号 (3) 紧 跟 在 变量 名 后 的 情形 ， 他 们 实际 含义 可 能 和 你 希望 的 不 同 。 


6. 5 练习 


答案 参见 附录 和 A， 














1， [了 写 一 个 程序 ， 提 示 用 户 输入 given name《〈 名 )， 并 给 出 其 对 应 的 family name《〈《 姓 )。 使 用 你 知道 的 人 名 ， 或 者 表 6-1 


《如 果 你 在 计算 机 上 花 了 太 多 时 间 ， 以 致 什么 人 都 不 认识 ): 








表 6-1 样本 数据 














输入 输出 
fred flintstone 
barney rubble 
wilma flintstone 






































2，[15] 写 一 个 程序 ， 读 入 一 串 单词 (一 个 单词 一 行 ) 争 ， 输 出 每 一 个 单词 出 现 的 次 数 。( 提 示 : 如 果 某 个 作为 数字 使 用 值 是 
undefined 的 ， 会 自动 将 它 转 换 为 0。) 如 果 输 入 单词 为 ffed，barney，dino，wilma，fred〈 在 不 同行 中 )， 则 输出 的 fred 将 为 
3 。 作 为 额外 的 练习 ， 可 以 将 输出 的 单词 按照 ASCII 排序 。 



































单词 的 原因 是 ， 我 们 还 没有 教 你 一 行 中 析 取 不 同 单词 的 方法 。 








e 行 
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第 七 章 正则 表达 式 








Perl 有 许多 区 别 于 























后 


人 一些 人 可 和 





GCC 


[ 











但 是 获得 这 种 能 力 是 需要 付 
你 要 学 习 一 门 新 的 程序 语言 


瑟 掉 Perl。 下 一 章 中 ， 我 们 将 介绍 如 何在 Perl 中 使 月 



































其 它 语言 的 特性 。 在 所 有 这 些 特 性 中 ， 最 
理 字 符 串 相关 的 问题 。 























要 的 一 条 是 对 正则 表达 式 的 文 持 。 它 允许 你 方便 ， 人 快捷 的 处 








代价 的 。 正 则 表达 式 Gegular expressions) 是 一 种 特殊 语言 写成 的 程序 , 内 舱 于 Perl 之 中 (是 的 ， 
。 庆 幸 的 是 ， 它 非常 简单 。)。 从 本 章 开 始 ， 我 们 将 进入 正则 表达 式 的 世界 ， 现 在 你 可 以 暂时 
日 正则 表达 式 。 



































争论 说 正则 表达 式 不 是 完备 的 程序 语言 。 我 们 不 准备 在 这 里 争论 这 个 问题 。 





























正则 表达 式 不 仅仅 是 Perl 的 一 部 分 ， 在 sed, aw 太 procmaai grep， 以 及 许多 程序 员 文 本 编辑 器 (programmers text editomD) 如 Vi， 
e1dcs， 还 有 一 些 更 深奥 的 程序 中 都 有 它 的 踪影 。 注 意 观察 ， 你 可 以 发 现 许 多 工具 都 文 持 正 则 表达 式 ， 如 Web 上 的 搜索 引 
擎 〈 通 常 由 Perl 书写 )，email 客户 端 ， 等 等 。 不 幸 的 消息 是 ， 不 同 的 正则 表达 式 的 实现 中 ， 语 法 会 有 些微 的 不 同 ， 因 此 需 
























































要 学 习 其 不 同 的 地 方 ， 例 如 需要 还 是 不 需要 反 什 线 ()。 


7. 工 什么 是 正则 表达 式 ? 


正则 表达 式 ,， 在 Perl 中 通常 被 称 为 模式 (pattern): 某 个 模板 是 否 匹 配 某 个 字符 串 争 。 由 于 存在 无 限 的 字符 串 ， 某 个 给 定 的 模 








了 


式 将 这 些 字 符 虽 
要 么 不 匹配 。 





分 成 两 类 














一 类 是 能 匹配 的 ， 一 类 是 不 能 匹配 的 。 这 里 没有 有， 或者， 大概， 几乎 那样 的 匹配 : 要 么 匹配 ， 

















急 某 些 学 究 可 能 认为 这 个 定义 不 够 严格 。 他 们 可 能 会 说 Perl 的 模式 根本 不 是 真正 意义 上 的 正则 表达 式 。 如 果 你 想 知道 更 多 的 关于 正则 表达 
式 的 信息 可 以 参看 Jeffrey Friedl(O"Reily) 的 书籍 《掌握 正则 表达 式 》(Mastering Regular Expessions)。 





























一 个 模式 可 以 匹配 多 个 字符 串 ，1 工 个 ， 2 个，3 个 ， 上 百 个 ， 或 者 无 限 个 。 也 可 能 匹配 除了 工 个 ， 多 个 ， 或 者 无 限 个 字符 


串 之 外 的 所 有 字符 串 争 。 我 们 将 正则 表达 式 看 作 一 种 由 

















简单 语言 实现 的 程序 ， 这 种 语言 只 有 一 个 任务 : 查找 某 个 字符 串 ， 








返回 “号 配 上 (it matches)? 或 者 “不 匹配 (it doesnot matchb)” 急 。 这 就 是 它 完 成 的 所 有 工作 。 











急 将 学 习 到 ， 你 可 以 让 某 个 模式 永远 匹配 或 者 永 不 匹配 。 在 极 少 情况 下 ， 这 也 是 有 用 的 ， 但 通常 是 错误 。 



































争 程 序 也 返回 一 些 信息 给 Perl。 其 中 的 一 种 信息 是 “正则 表达 式 内 存 (regular expressions memories)”， 这 将 在 后 面 会 学 习 到 。 





你 可 能 在 使 用 Unix 的 grep 命令 时 ， 见 过 正则 表达 式 ， 
某 行 提 到 过 flint， 同 时 同一 行 后 面 提 到 stone， 那 你 可 以 如 下 的 使 用 grep 命令 : 








$grep “flint.*stone” chapter*.txt 

















它 会 输出 匹配 上 模式 的 行 。 例 如 ， 如 果 想 查看 某 个 给 定 文件 中 是 


弄 








chapter3.txt:a piece of flint, a Stone which may be used to start a fire by striking 
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chapter3.txt:found obsidian, flint, granite, and Small stones of basaltic rock, which 


chapter9.txt:a flintlock rifle in poor condition. The sandstone mantle held Several 














AAA 





不 要 将 正则 表达 式 和 shell 中 的 文件 名 匹配 模式 ，glops 混淆 了 。 通 常 glob 是 指 ， 在 Unix shell 下 输入 *.pm 将 匹配 所 有 结尾 
为 .pm 的 文件 名 。 上 一 个 例子 使 用 的 glob 为 chapter*.txt。 (你 可 能 已 经 注意 到 我 们 将 模式 括 起 来 了 ， 来 防止 shell 将 其 作为 
glob 来 处 理 ) 虽然 glob 和 正则 表达 式 有 许多 相同 的 符号 ， 但 其 作用 并 不 相同 争 。 第 十 二 章 中 将 介绍 glops 。 







































































81obps 有 时 也 被 称 作 模式 。 但 严重 的 问题 是 ， 某 些 面 向 初级 用 户 的 书籍 〈 可 能 是 菜鸟 写 得 ) 将 g81ops 叫做 “正则 表达 式 ”， 这 绝对 是 错误 
的 。 


7. 2 使 用 简单 的 模式 


要 匹配 某 个 模式 《正则 表达 式 ) 和 $_ 的 关系 ， 可 以 将 模式 放 在 正 斜 线 V/) 之 间 ， 如 下 : 


$_=“"“yabba dabba doo”; 
jif(/abba/){ 


print “It matchedln ; 


} 


表达 式 /abba / 将 在 $_ 寻 找 这 四 个 字母 。 如 果 找 到 ， 则 返回 tue， 在 本 例 中 ,， 它 出 现 了 不 止 一 次 ， 但 结果 没什么 不 同 。 总 之 ， 
如 果 找 到 了 ， 则 匹配 上 ;如果 没 找到 ， 则 没 匹配 上 。 























于 模式 匹配 通常 返回 true 或 false， 因 此 经 常用 在 证 或 while 的 条 件 表达 式 部 分 。 


























所 有 在 双 引 号 中 的 转 义 字符 在 模式 中 均 有 效 ， 因 此 你 可 以 使 用 coketsprite/ 来 匹配 11 个 字符 的 字符 串 coke，tab( 制 表 符 )， 


Sprite。 


7. 2. 1 元 字符 





如 果 模 式 只 能 匹配 字面 上 的 字符 串 ， 则 其 用 处 不 会 大大 。 这 也 是 引入 特殊 字符 的 原因 ， 它 们 被 叫做 元 字符 (metacharacters)， 
在 正则 表达 式 中 具有 特殊 的 含义 。 








上 





























例如 , 点 (是 通配符 , 它 可 以 匹配 任何 单个 的 字符 , 但 不 包括 换行 符 (Cn7。 因 此 , 模式 /bety/ 将 匹配 betty。 同 时 也 匹配 betsy 
bet=y bety， 或 者 说 任意 字符 串 后 接 bet, 然 后 是 任意 的 单个 字符 〈 不 包括 换行 符 )， 后 接 y。 它 不 会 匹配 bety，betsey， 因 为 
t 和 y 之 间 不 是 一 个 字符 。 点 (J 只 匹配 一 个 字符 。 



























































如 果 想 匹配 名 号 《英语 中 句号 就 是 一 个 点 : 译 者 注 》 可 以 使 用 点 ()。 但 由 于 点 (.) 可 以 匹配 任意 的 单个 字符 《〈 除 换行 符 外 )， 
则 其 结果 比 你 希望 的 要 多 。 如 果 具 希望 点 () 匹 配 句号 ， 可 以 使 用 反 和 斜 线 。 这 条 规则 对 Perl 正则 表达 式 中 所 有 元 字符 均 有 效 ; 
元 字符 前 使 用 反 斜 线 将 使 它 变 成 普通 的 字符 。 如 ， 模 式 /3\14159/ 中 的 点 (J 即 不 是 通配符 。 
























































反 和 斜 线 是 第 二 个 元 字符 。 如 果 需 要 真正 的 反 斜 线 ， 需 要 重复 使 用 两 个 反 斜 线 ， 这 和 Perl 中 其 它 情况 下 是 一 样 的 。 
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7. 2. 2 简单 的 量词 
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通常 ,需要 模式 中 某 些 串 是 可 以 重复 的 。 星 号 (5 表 示 匹 配 前 





项 0 次 或 者 多 次 。 因 此 , /fredNt*barney/ 将 匹配 上 fred 和 barney 


之 间 有 任意 个 制 表 位 (tab) 的 字符 串 。 它 可 以 匹配 “fredxbarney ， 其 间 有 一 个 tab; 匹配 “fredvttbarney”， 其 间 有 两 个 制 表 位 ; 











“fredvtttbarney 其 间 有 三 个 制 表 位 ; “fredbarney”， 暴 



































是 任意 个 制 表 符 ， 但 不 能 是 其 它 的 字符 。 可 以 这 样 看 








学 上 是 乘法 运算 符 )。 


如 果 和 希望 包括 不 同 的 字符 ， 怎 么 办 呢 ? 点 () 可 以 匹配 任何 单字 符 争 ， 因 
/fred.*barmey/ 将 匹配 fred 和 barmey 之 间 有 任意 多 个 任意 字符 (不 含 换行 符 ) 的 字符 串 。 任 意 行 如 果 前 
其 间 为 任意 字符 〈 字 符 串 ) 都 将 匹配 上 。 我 们 将 . 癌 4 做 “任意 字符 串 匹 配 模式 ”， 因 为 任意 的 














换行 符 )。 




















待 


星 号 (: 








争 除 了 换行 符 。 以 后 我 们 将 不 再 提醒 你 ， 因 为 你 已 经 知道 了 。 许 多 时 候 你 不 用 担 
不 应 该 把 这 个 细节 坊 邱 ， 因 为 说 不 定 某 人 就 在 你 的 



































以 匹配 前 面 一 项 的 一 个 或 多 个 : /fred +barmney/ 
它 不 会 匹配 fredbarney， 因 为 加 (+) 意 指 一 个 或 多 个 ， 因 此 至 少 是 一 个 。 可 以 这 样 


有 一 项 。 2 









































的 这 个 项 ， 出 现 ? 或 者 不 出 现 ? ” 








Ce 
意思 




















间 什 么 也 没有 。 这 是 由 于 

















“前 面 的 东 





























已 zw Ape 口 


字符 虽 





























号 (3%) 是 指 “0 个 或 者 多 个 ” 因此 其 间 可 以 
j， 重 复 任 意 次 数 ， 包 插 0 次 ”( 因 为 * 号 在 数 





此 .将 匹配 任意 字符 任意 多 数 。 这 就 是 说 模式 
看 有 fred, 后 面 有 barney， 
均 能 被 匹配 上 〈 不 包括 

















心 这 个 问题 ， 

















中 加 入 了 换行 符 ， 因 此 应 当 记 住 点 (. 














星 号 的 正 是 叫 法 是 数量 词 (quantifieb， 意 指 其 可 以 指 代 多 个 前 面 的 项 。 它 不 是 唯一 的 





























是 fred 和 barney 之 间 由 空格 分 开 


还 有 第 三 个 数量 词 ， 其 限制 性 更 强 。 它 是 问号 0)， 其 含义 是 前 面 一 个 项 出 现 一 次 ， 或 者 不 出 现 。 也 就 是 说 ， 前 面 这 个 项 出 


现 1 次 或 者 0 次 ， 此 外 不 会 有 其 它 情 况 。 因 此 ，/barm-?bamm/ 只 匹配 : bamm-bamnm 或 bammbamm。 这 很 容易 记 住 :“ 前 


这 三 个 数量 词 必 须 紧 跟 在 某 些 项 的 后 面 ， 因 为 它 是 指 前 面 项 重复 的 次 数 。 

















7. 2. 3 模式 中 的 分 组 

















急 星 号 人 9) 意 指 匹配 上 0 次 或 者 多 次 fred。 当 为 0 时 ， 那 什么 字符 串 都 能 被 匹配 上 。 这 个 模式 能 




















7. 2. 4 选择 符 





竖 线 0， 在 这 种 用 法 中 通常 被 读 作 “或 Cor) ” 
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中 并 不 含有 换行 符 。 但 





词 ， 加 (人 +) 也 是 。 加 人) 的 意思 是 可 









































格 。( 空 格 不 是 元 字符 )。 
待 加 人 ):“ 最 后 一 项 , 〈 可 选 的 ) 至 少 还 














| 

















括号 也 是 元 字符 。 在 数学 中 ， 括 号 (0O) 用 来 表示 分 组 。 例 如 ， 模 式 /fred+/ 能 匹配 上 如 fredddddddd， 这 样 的 字符 串 ， 但 这 种 字 
符 串 在 实际 中 没有 什么 用 途 。 模式 /fred)+/ 能 匹配 上 像 ffedfredfred 这 样 的 字符 串 , 这 更 可 
呢 ? 它 将 匹配 上 像 hello,world 这 样 的 字符 串 争 。 





〖 么 横 式 /fred)x/ 


























匹配 左边 的 或 者 右边 的 。 如 果 竖 线 左边 没有 匹配 上 ， 则 匹配 右边 。 
此 ，/fredlbarneylbetty/ 将 匹配 出 现 过 fred， 或 者 barney， 或 者 betty 的 字符 串 。 
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现在 你 可 以 书写 像 /fred( ND+barney/ 这 样 的 模式 ， 它 将 匹配 fred，barney 以 及 中 间 由 空格 ， 制 表 符 (tab)， 或 者 二 者 混合 所 组 
成 的 字符 串 。 加 (+) 是 指 重复 1 次 或 多 次 ; 每 重复 一 次 ，( ID 则 有 可 能 匹配 一 个 空格 ， 或 者 一 个 制 表 符 争 。 但 fred 和 barney 
之 间 这 些 字符 中 《空格 ， 制 表 符 ) 的 其 中 之 一 必须 出 现 一 次 。 






































争 如 果 使 用 字符 类 (character class) 进 行 这 种 匹配 将 更 有 效 ， 这 在 本 章 后 面 会 介绍 。 











如 果 希 望 fed 和 bamey 之 间 的 字符 是 一 样 的 ， 可 以 将 模式 写成 /fred( +INt+)barey/。 在 本 例 中 ， 分 隔 符 必 须 全 是 空格 或 者 全 
是 制 表 符 。 














模式 /fred (andlor) barney/ 能 匹配 如 下 两 种 字符 串 : fred and barney fred or barney 争 。 也 可 以 将 模式 写成 : /fred and barneylfred 
or barney/， 但 这 样 书写 的 字符 更 多 。 并 且 其 效率 也 更 低 ， 这 依赖 于 正则 表达 式 引擎 中 所 使 用 的 优化 方法 。 




















多 单词 and 和 or 在 正则 表达 式 中 不 是 操作 符 ! 它们 在 正则 表达 式 中 就 是 其 本 来 的 含义 : 单词 and, or。 




















7. 3 字符 类 


字符 类 ， 是 方 括号 [中 的 一 列 字 符 ， 可 以 匹配 上 括号 内 出 现 的 任意 单个 字符 。 它 匹配 一 个 字符 ， 但 这 个 字符 可 以 是 列 中 的 
任意 一 个 。 





























例如 ， 字 符 类 [abcwxyz] 可 以 匹配 上 括号 内 七 个 字母 中 的 任意 一 个 。 为 了 方便 ， 我 们 可 以 使 用 连 字 号 (-) 来 表示 某 个 范围 的 字 
母 ， 因 此 上 例 也 可 以 写 做 [a-cw-z]。 上 面 例子 省 略 的 字符 不 多 ， 但 像 [azA-Z] 将 非常 方便 ， 利 用 它 不 需要 输入 52 个 字符 登 。 
你 可 以 使 用 和 双 引 号 相同 的 字符 简写 方法 ， 例 如 类 [\000A\177] 可 以 匹配 上 任意 的 七 比特 的 ASCII 字符 。 争 。 当 然 ， 字 符 类 
只 是 模式 的 一 部 分 ， 单 独 的 字符 类 在 Perl 中 没什么 实际 的 意义 。 例 如 ， 你 可 能 见 到 如 下 的 代码 ; 












































注 意 这 52 个 字母 不 包括 A, 忆 ,人 和 立 。 如 果 人 允许 处 理 Unicode， 则 上 述 字符 的 范围 将 自动 的 变化 ， 来 做 正确 的 工作 。 



































急 这 里 ， 使 用 的 是 ASCII 而 非 EBCDIC。 





$_=“The HAL-9000 requires authorization to continue.”; 
it(UHAL-[0-9]+/){ 
Print “The string mentions some model of HAL computerm ; 





有 时 ， 指 出 没有 被 字符 类 包含 的 字符 更 加 容易 。 字 符 类 前 使 用 符号 ^ 将 取 此 字符 类 的 补 集 。 也 束 是 说 ，[Adef]] 将 匹配 上 这 三 
个 字符 中 之 外 的 任意 单个 字符 。[An-z] 将 匹配 上 n -, z 之 外 的 任何 字符 。( 连 接 符 G 〇 前 面 使 用 反 斜 线 的 原因 是 ， 它 在 此 字符 
类 中 有 特别 的 含义 〈 表 示 字 符 的 范围 : 译 者 注 )。 但 /HAL-[0-9]+/ 中 第 一 个 连接 符 (3) 前 不 需要 反 和 斜 线 ， 因 为 此 时 的 连接 符 不 
会 被 理解 为 有 特殊 的 含义 。) 









































7. 3. 1 字符 类 的 简写 





有 一 些 字 符 类 出 现 的 非常 频繁 ， 因 此 提供 了 其 简写 形式 。 例 如 ， 任 何 数字 的 类 ，[0-9]， 可 以 被 简写 为 ; 4。 因 此 ，HAL 这 
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个 例子 可 以 被 写作 /HAL-\d+/。 











WwW 被 称 作 “word 字符 : [A-Za-z0-9 ]。 如 果 你 的 “words "由 通常 的 字母 ， 数 字 ， 下 划 线 组 成 ， 那 你 将 非常 喜欢 它 。 通 常 认 
为 “word'" 由 字母 ， 连 接 符 (]， 撒 号 〈') 银 组 成 ,我 们 希望 能 改变 这 种 定义 争 。 因此 使 用 它 ， 请 记 住 我 们 对 “word "的 定义 ， 
字母 ， 数 字 ， 下 划 线 组 成 。 































































































急 至 少 ， 在 英语 中 是 这 样 。 在 其 它 语 言 中 ， 其 words 由 不 同 的 符号 组 成 。 查 看 perllocale 的 帮助 手册 了 解 更 多 的 信息 。 
多 当 碍 看 ASCI 编码 的 英语 文本 时 ， 我 们 遇 到 单 引号 和 扩 号 () 是 相同 字符 的 问题 ， 因 此 很 难说 caf' 是 cat 和 一 个 撒 号 ()， 还 是 cat 后 接 单 引 



































沾 
号 。 这 可 能 是 计算 机 还 不 能 接管 世界 的 一 个 原因 @。 














当然 ，\w 不 能 匹配 单词 ， 而 只 能 匹配 单个 字符 。 为 了 匹配 整个 单词 ， 需 要 后 接 加 号 。 模 式 /fred \w+ barmey/ 将 匹配 fed， 衬 
格 ， 一 个 “单词 《word) ” 然后 是 空格 和 barney。 因 此 ， 如 果 fred 和 bamey 之 间 有 一 个 单词 争 ， 由 单个 空格 分 隔 开 ， 它 将 
能 匹配 上 。 






























































急 我 们 将 停止 在 word 上 加 引号 ;现在 你 已 经 知道 其 是 由 字母 -数字 -下 划 线 组 成 的 。 




















你 可 能 已 经 注意 到 在 前 一 例 中 ， 如 果 能 更 加 灵活 的 匹配 空白 将 很 方便 。\s 对 于 匹配 空白 《whitespace ) 将 非常 方便 。 它 等 价 
于 [tv ]， 其 含 5 个 空白 字符 : 格式 符 〈form-feed)， 制 表 符 (tab) ， 换 行 符 ， 回 车 ， 以 及 空格 符 。 同 其 它 简写 符号 一 样 
NS 匹配 此 类 中 的 单个 字符 ， 如 果 使 用 \s*# 将 匹配 任何 个 数 的 空白 〈 包 括 没 有 )， 或 者 s+ 匹 配 一 个 以 上 的 空白 《事实 上 ， 很 少 
见 到 单独 使 用 s， 而 不 使 用 任何 的 数量 词 (*, +) )。 由 于 这 些 空 白 符 看 起 来 类 似 ， 因 此 可 以 使 用 这 种 简写 形式 ， 将 它们 统一 处 
理 。 
































站 

















































































































7. 3. 2 简写 形式 的 补 集 





某 些 时 候 ， 你 可 能 希望 得 到 这 三 种 简写 形式 的 补 集 。 如 果 那 样 的 话 ， 你 可 以 使 用 [^\d]j, [Aw]， 和 [As]， 其 含义 分 别 是 ， 非 数 
字 的 字符 ， 非 word《〈 记 住 我 们 对 word 的 定义 ) 的 字符 ， 和 非 空 白 的 字符 。 也 可 以 使 用 它们 对 应 的 大 写 形式 : \D,\W, \S 来 
完成 。 它 们 将 匹配 它们 对 应 的 小 写 形式 不 能 匹配 上 的 字符 。 
































这 些 简 写 形式 可 以 在 字符 类 中 使 用 ， 或 者 在 大 的 字符 类 中 的 中 括号 里 面 使 用 。 也 就 是 说 你 可 以 使 用 /AdA-Fa +/ 来 匹配 十 六 
进 制 〈 底 为 16) 的 数字 ， 它 将 ABCDEF( 或 者 其 小 写 形式 ) 作 为 附加 的 数字 (11 到 15 )。 
































另 一 个 类 字符 [IdD]， 它 的 意思 是 任何 数字 ， 和 任何 非 数字 ， 则 意 指 任何 字符 。 这 古 匹 配 所 有 字符 的 一 种 通用 方法 ， 甚 至 包 
括 换行 符 ， 而 点 4) 匹配 除 换行 符 以 外 的 任何 字符 。 而 [AdD] 则 完全 没 用 ， 因 为 它 匹配 既 非 数字 也 非 非 数字 的 字符 ， 那 什么 
也 不 是 。 









































7. 4 练习 





参见 附录 A 查看 下 面 习题 的 答案 : 

















记 住 ， 正 则 表达 式 能 完成 的 工作 经 常 让 你 吃惊 。 这 也 是 本 章 练习 比 其 它 章节 重要 的 原因 。 
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1 [10] 写 一 个 程序 ， 输 
备 一 个 小 的 文本 文件 
下 面 练习 的 输入 。 








2. [6] 修 改 上 面 的 程序 ， 














3. [6] 写 一 个 程序 ， 输 吕 





4. [8] 写 一 个 程序 ， 输 日 
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出 所 有 提 到 fred 的 行 〈 不 要 输出 其 它 行 )。 如 果 输 入 字符 串 Fred, fredrick, Alfred， 能 匹配 上 吗 ? 准 





























F， 其 中 包含 如 :“fred lintsotne” 以 及 类 似 的 信息 。 使 用 这 个 文本 文件 作为 此 程序 的 输入 ， 以 及 本 节 


允许 匹配 Fred。 现 在 它 能 匹配 ，EFred, fredrick Alfred 吗 ?〈 将 这 些 名 字 加 入 输入 文件 中 ) 

















8 现 名 号 () 的 行 ， 忽 略 其 它 行 。 使 用 前 面 练习 中 的 文 们 


上 二 
1 人 





进行 练习 : 它 能 找到 Mr Slate 吗 ? 


上 有 一 个 字母 大 写 ， 而 非 所 有 字母 都 大 写 的 行 。 它 能 匹配 Fred ， 而 不 匹配 fred 和 FRED 吗 ? 


5 [8] 额 外 的 练习 : 写 一 个 程序 ， 它 能 输出 所 有 同时 提 到 wilma 和 fred 的 行 。 
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第 八 章 正则 表达 式 的 应 用 








在 前 一 童 ， 我 们 讨论 了 正则 表达 式 。 现 在 你 将 学 习 怎 样 在 Perl 中 使 用 正则 表达 式 。 








8. 工 使 用 mV/ 匹配 


我 们 曾经 将 模式 放 在 一 对 正 斜 线 (/) 里 面 ， 如 /fred/。 这 是 m/ (模式 匹配 ) 的 一 种 简写 。 同 qw// 操 作 一 样 ， 可 以 使 用 任何 
成 对 的 分 隔 符 。 因 此 ， 可 以 使 用 m(fred), m<fred>, mffred}j, m[fred]， 或 者 m,fred,, mlfredl mAfrfed^， 其 它 非 成 对 的 分 隔 符 也 
可 以 旬 。 







































































急 非 配对 分 隔 符 是 那些 “ 左 ” 和 “ 右 ” 是 相同 的 ， 两 头 使 用 的 是 同一 个 符号 。 












































如 果 使 用 正 斜 线 (0/) 作为 分 隔 符 ， 则 可 以 省 略 掉 前 面 的 mm。 由 于 Perler 喜欢 少 输 入 字符 ， 因 此 大 多 数 模 式 使 用 的 是 正 斜 线 ， 
如 /fred/。 





























使 用 一 个 不 会 在 模式 中 出 现 的 字符 作为 分 隔 符 争 。 如 果 想 写 一 个 匹配 web URL 开头 部 分 的 模式 ， 你 可 能 使 用 /http:VV/ 来 匹 
配 http:/。 但 如 果 使 用 m%ehttp:/% 将 更 易于 阅读 ， 书 写 ， 维 护 ， 以 及 调试 。 使 用 花 括 号 〈{} ) 作为 分 隔 符 也 是 很 平常 的 。 
如 果 你 使 用 的 是 专 为 程序 员 设计 的 文本 编辑 器 ， 由 于 它 能 自动 从 开花 括号 跳 到 闭 花 括号 ， 这 对 于 维护 代码 将 非常 有 用 。 


















































急 如 果 使 用 配对 的 分 隔 符 ， 那 不 用 当心 模式 内 部 会 出 现 这 些 分 隔 符 ， 因 为 通常 模式 内 部 的 分 隔 符 也 是 配对 的 。 因 此 ，m(fred(.:)barney)， 
mtfvw{2,}} m[wilma[m 和 +betty] 是 正确 的 。 对 于 尖 插 号 0《 和 >)， 它 们 通常 不 是 配对 的 。 如 模式 m{fCd+)sx>=?\s*(d+)}, 如 果 使 用 尖 括 号 ， 
模式 中 的 尖 括 号 前 因 当 使 用 反 斜 线 (\)， 以 免 模 式 被 过 早 的 结束 掉 。 



























































争 记 住 ， 正 斜 线 不 是 元 字符 ， 如 果 它 不 是 分 隔 符 ， 则 不 需 在 前 面 使 用 反 和 斜 线 。 


8.， 2 可 选 的 修饰 符 


有 几 个 修饰 符 (modifienD， 通 常 叫做 标记 (flag)， 可 以 后 绥 在 正则 表达 式 后 面 来 该 变 其 默认 的 行为 。 















































8. 2. 1 不 区 分 大 小 写 : , 儿 








要 创建 一 个 大 小 写 无 关 的 模式 ， 如 匹配 FRED 时 ， 也 能 匹配 上 fred, Fred， 可 以 使 用 修饰 符 让: 





Print “Would you like to play a game2”; 
chomp($_ = <STDIN>); 
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iftUyes/ {# 大 小 写 无 关 
print “In that case, [recommend that you go bowling.\n ; 


} 


8. 2. 2 匹配 任何 字符 : /s 


默认 情况 下 ， 点 () 不 匹配 换行 符 ， 这 对 于 “单行 中 查找 ”的 问题 能 很 好 解决 。 如 果 你 的 字符 串 中 有 换行 符 ， 并 希望 点 () 能 
配 它们 ， 那 可 以 使 用 /s 这 个 修饰 符 。 它 将 模式 中 点 (J) 急 的 行为 变 成 同 字符 类 [AdD] 的 行为 类 似 : 可 以 匹配 任何 字符 ， 包 括 换 
行 符 。 从 下 例 中 可 见 其 区 别 : 
































争 如 果 你 想 改变 其 中 的 一 部 分 ， 但 不 是 全 部 ， 那 可 以 将 此 部 分 用 [NdND] 代 替 





$_= "IsawBarnewndown at the bowing alleynwith Fredvnlast night\n”; 
ii(/Barney.*Fred/s){ 
Print “That string mentions Fred after Barneyln ; 


} 








如 果 不 使 用 8s， 那 么 上 述 模式 将 不 能 被 匹配 上 ， 因 为 这 两 个 字符 不 在 同一 行 中 。 


8. 2. 3 添加 空格 : MX 








久 修 饰 符 ， 允 许 你 在 模式 中 加 入 任何 数量 的 空白 ， 以 方便 阅读 : 








人 ?NdHN2Nds/ 并 文 是 什么 舍 义 ? 
/-? \d+ \? \dx MX # 要 好 些 

















由 于 /x 允许 模式 中 使 用 空白 ,那么 模式 中 的 空格 ， 制 表 符 将 被 忽略 。 可 以 在 空格 前 加 上 反 和 斜 线 或 者 使 用 《许多 方法 中 的 一 
种 )， 但 匹配 空白 更 常用 的 方法 是 使 用 \sGs* 或 \s+)。 





























Perl 中 ， 注 释 可 以 被 作为 空白 ， 因 此 使 用 x， 可 以 在 模式 中 加 上 注释 : 





/ 

-? “# 可 选 的 负 号 

\d+ # 小 数 点 前 一 个 或 多 个 十 进 制 数字 
\? # 可 选 的 小 数 点 

\d* # 小 数 点 后 一 些 可 选 的 十 进 制 数 字 
信 “# 模 式 结束 



































井 号 昌 表 示 后 面 是 注释 ， 如 果 需 要 匹配 井 号 ， 可 以 使 用 \# 或 革 。 注 意 不 要 在 注释 中 使 用 财 分 隔 符 ， 和 否则 将 结束 此 模式 匹配 。 
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8. 2. 4 将 可 选 字符 结合 起 来 


如 果 在 一 个 模式 中 需 使 用 不 止 一 个 修饰 符 ， 可 以 一 个 接着 一 个 。 其 顺序 是 不 重要 的 ; 





ifWbarney.*fredy/is/){ # 广 和 /S 
Print “That string mentions Fred after Barneyln ; 


} 





下 面 是 包含 注释 的 版 本 ; 














| 
barney 。# 小 个 子 小 伙 
兴 # 可 以 包含 任何 字符 





fred # 嗓 门 大 的 小 伙 
}sibo{  # 修 饰 符 包括 包括 /s, 外 入 
Print “That string mentions Fred after BarneyWn ; 


} 
































注意 这 里 的 分 隅 符 : 花 括 号 ， 它 允许 那些 专 为 程序 员 设 计 的 文本 胞 辑 器 可 以 从 正 表 达 式 的 开端 跳 到 末端 。 


8. 2. 5 其 它 选项 














还 有 许多 修饰 符 ， 将 在 遇 到 它们 时 再 讨论 。 你 也 可 以 阅读 perlop 帮助 手册 中 介绍 mV 的 部 分 ， 或 者 本 章 后 面 正 则 表达 式 操 作 














的 部 分 。 


8. 3 错 定 








默认 情况 下 ， 如 果 模 式 在 字符 串 开 头 没 能 匹配 上 ， 它 会 顺 着 字符 串 下 去 ， 直 到 匹配 上 为 1 
































F。 如 果 使 用 了 错 定 (anchors) 则 可 

















以 要 求 模式 在 特定 的 位 置 进行 匹配 。 








3 























符号 ^( 脱 字 字 符 争 ) 表示 在 字符 串 的 开头 进行 匹配 ， 而 符号 $ 则 表示 在 结尾 争 。 因 此 ， 模 式 /Afred/ 只 匹配 字符 串 的 开头 部 分 ; 











它 不 会 匹配 上 manfred man 。 而 /rock$/ 只 在 结尾 处 匹配 其 不 会 匹配 上 kmute rockne。 




















急 是 的 ， 在 模式 中 ^， 有 其 它 的 用 途 。 在 字符 类 中 ， 如 果 将 其 放 在 最 前 面 ， 将 会 得 到 此 集合 的 补 集 。 但 在 字符 类 外 面 ， 它 就 成 了 元 字符 ， 从 
























































而 有 了 别 的 含义 : 表明 是 字符 串 的 开头 。 字 符 就 那么 几 个 ， 有 时 你 不 得 不 重复 使 用 它们 









































信 事 实 上 ， 它 能 匹配 字符 串 的 结尾 部 分 ， 或 者 换行 符 处 。 因 此 会 匹配 一 个 字符 串 的 结尾 部 分 ， 无 论 
人 


日 记 住 /fred$/ 能 同时 匹配 上 “fred” 和 “fredm”。 









































是 否 含有 换行 符 。 许 多 人 都 不 担 = 关心 





有 时 ， 想 同时 使 用 这 两 个 锚 定 来 确保 匹配 整个 字符 串 。 一 个 经 常 使 用 的 例子 是 /As*$/， 它 将 匹配 一 个 空 行 (blank line)。 这 
里 的 "blank 《空白 ) ”， 可 以 是 空白 符 ， 如 制 表 符 ， 空 格 等 ， 它 们 是 不 可 见 的。 能 被 匹配 上 的 行 看 起 来 都 是 一 样 的 ， 因 此 这 
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个 模式 将 所 有 的 空白 按 一 种 方法 来 处 理 。 如 果 没 有 锚 定 ， 则 它 还 会 匹配 上 非 空 行 。 








8. 3. 1 词 锚 定 























销 定 不 仅仅 针对 字符 串 的 两 头 。 词 界 锚 定 ，\b， 是 针对 单词 使 用 的 。 如 Abfredvb/ 可 以 匹配 上 单词 fed， 但 不 能 匹配 frederick， 
alfred, man fred mann。 这 同 字 处 理 软件 中 的 “全 字 匹 配 (match whole words only)” 是 类 似 的 。 


























镶 某 些 正 则 表达 式 实 现 中 开头 的 锚 定 和 结尾 锚 定 不 同 ， 但 Perl 中 均 使 用 bb。 





























这 些 单 词 (words) 不 是 你 或 者 我 通常 认为 的 那样 ; 它们 是 \w 类 型 ， 由 通常 的 字母 ， 数 字 ， 下 划 线 组 成 。\b 将 从 开头 或 结尾 
匹配 这 些 \w 类 型 的 字符 。 





















































图 8-1 中 ， 每 一 个 “ 词 (word)” 下 面 有 灰 线 ， 箭 头 标明 \b 匹配 的 地 方 。 给 定 字 符 串 总 有 偶数 个 词 界 ， 因 为 每 一 个 词 均 有 两 
个 界限 (开始 和 结尾 ) 。 














词 是 字母 ， 数 字 ， 下 划 线 组 成 的 序列 。 这 种 意义 下 的 词 可 由 Aw+/ 匹 配 上 。 下 句 中 有 5 个 词 :Thabsa,word, 以 及 boundary 争 。 
词 上 的 引号 不 会 改变 词 界 的 位 置 ， 这些 词 是 由 \w 字符 组 成 的 。 























图 8-1 词 界 :Nb 





That's 3 “word” boundary 




















急 这 里 你 可 以 看 到 ， 我 们 为 什么 希望 能 改变 “word "的 定义 ，That's 应 当 是 一 个 单词 ， 而 不 是 两 个 单词 ， 虽 然 中 间 有 撒 号 〈”)。 即 便 是 在 通 
常 的 英文 文本 中 ， 上 述 看 法 也 符合 通常 的 观点 ， 还 能 找到 其 它 字符 的 些微 差别 。 












































每 一 个 箭头 指向 下 划 线 的 开头 和 结尾 处 ， 因 为 词 界 锚 定 : \b 只 匹配 这 样 的 词 。 











词 界 锚 定 是 非常 有 用 的 , 如 果 不 希望 cat 匹配 上 delicatessen， 而 dog 匹配 上 boondoggle， 或 者 fish 匹配 上 selfishness 。 有 时 
你 只 想 要 一 个 词 界 销 定 ， 当 使 用 Abhunt 将 匹配 上 像 hunt hunting, hunter， 这 样 的 单词 ， 但 不 会 匹配 shunt， 而 /stone\b/ 将 匹 
配 sandstone, flintstone， 而 不 能 匹配 上 capstones 。 
































已 














非 词 界 锚 定 为 B。 它 将 在 任何 非 \b 匹配 的 点 上 进行 匹配 。 因 此 ， 模 式 Absearch\B/ 将 匹配 searches, searching, searched， 但 不 能 
匹配 search， 或 者 researching 。 














8. 4 绑 定 操作 符 ，=~ 


对 $_ 进 行 匹 配 只 是 默认 的 行为 ， 使 用 绑 定 操作 符 (=~) 将 告诉 Perl 将 右边 的 模式 在 左边 的 字符 串 上 进行 匹配 ， 而 非 对 $_ 匹 配 。 
例如 : 
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my $some_other = Idream of betty rubble. 
这 $some_other =~ Abrub/){ 
print“Aye, there's the rubn ; 


第 一 次 见 到 绑 定 操作 符 (binding operator: =~)， 可 能 觉得 它 有 些 像 赋值 操作 符 ， 但 它 不 是 。 其 含义 是 :“ 这 个 模式 默认 将 对 
$ 进行 匹配 ， 但 此 时 将 对 左边 的 字符 串 进行 匹配 ”如果 没有 绑 定 操作 符 ， 则 此 表达 式 将 对 $_ 匹 配 。 

















在 下 面 的 例子 中 〈 有 些 不 寻常 )，$likes_perl 将 根据 用 户 的 输入 而 得 到 一 个 boolean 值 。 它 有 一 些 quick-and-ditry， 因 为 输入 
行 很 快 就 被 丢弃 了 。 这 段 代码 将 读 入 一 行 ， 由 右边 的 模式 进行 匹 配 ， 然 后 丢弃 此 输入 争 。 它 没有 使 用 $_。 




















争 和 输入 的 字符 不 会 自动 存储 在 $_ 中 ， 除 非 行 输入 操作 〈<STDIN>) 单独 出 现在 while 循环 的 条 件 判 断 部 分 。 








Print “Do you like Perl2”; 
Imy $likes_perl = (<STDIN> =~ Abyes\/; 
##[Times passeS... 
这 $likes_perD){ 
Print “You Said earlier that you like Perl, 3So...m 


} 











由 于 绑 定 操作 有 非常 高 的 优先 级 ， 因 此 ， 模 式 测 试 部 分 的 括号 不 是 必需 的 ， 下 面 的 代码 和 上 面 代码 的 含义 是 一 样 的 。 它 将 
测试 部 分 的 结果 《〈 而 非 行 输入 ) 返回 给 变量 $likes_perl 








my $likes_perl = <STDIN> =~ 八 byes\by/ii 


8. 5 模式 内 的 内 插 








正则 表达 式 可 以 被 内 插 ， 如 同 双 引号 字符 串 一 样 。。 这 允许 我 们 快速 地 写 出 类 似 grep 的 程序 : 








#! /usYbin/perl 一 W 
Imy $what =“larry”; 














while(<>jf 
iiwhab/{ # 在 字符 串 前 面 进行 匹配 
print“We saw $what in beginning of $_>”; 
} 























当 程序 运行 时 ， 横 式 将 被 $what 的 值 代替 。 在 本 例 中 ， 它 同 使 用 /Adarry)/ 是 一 样 的 ， 在 行 的 开头 处 查找 larry。 








如 果 没 有 在 程序 中 具体 指出 Swhat 的 值 ， 也 可 以 在 命令 行 中 输入 ， 然 后 使 用 参数 @ARGYV: 
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my $what = Shift @ARGYV; 
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如 果 命 令 行 中 第 一 个 参数 是 ffedlbarney， 则 模式 为 /A(fredlbarneyy/: 在 行 首 查找 fred 或 者 barney 合 。 括 号 〈 在 查找 larry 的 








例子 中 不 是 必须 的 ) 是 非常 








要 的 ， 如 果 没 有 它 ， 则 在 行 首 查找 fred， 或 在 此 行 中 任意 位 





查找 barney。 











镶 机 敏 的 读者 知道 在 命令 中 通常 不 能 输入 fredlbarney, 因为 竖 线 是 shell 的 元 字符 (shell metacharacter)。 查 看 你 的 shell 文档 , 了 解 怎 样 将 命 








令 行 中 的 参数 括 起 来 。 











使 用 上 面 的 代码 ， 可 以 通过 @ARGY 来 得 到 模式 ， 现 在 的 程序 有 点 Unix 的 grep 命令 的 味道 了 。 但 我 们 要 小 心 元 字符 。 
如 果 $what 的 值 为 “fed(barney'， 这 个 模式 是 /A(fred(barney)/。 上 述 模式 是 不 能 工作 的 ， 会 由 于 错误 使 用 正则 表达 式 而 使 





程序 震 掉 。 利 用 一 些 高 级 技术 争 ， 你 可 以 捕捉 到 这 种 错误 〈 或 者 在 开始 时 就 阻止 这 些 元 字符 )， 而 不 至 于 让 程序 震 掉 。 但 















































现在 ， 只 需 知 道 如 果 用 户 被 赋予 正则 表达 式 的 强大 能 力 ， 则 他 们 有 责任 正确 的 使 用 它们 。 





























急 可 以 使 用 eval 块 来 捕 提 错误， 或 者 使 用 quotemea( 或 者 其 等 价 形式 ，\Q) 将 内 插 部 分 引用 起 来 ， 使 之 不 会 被 当 作 正则 表达 式 来 处 理 。 


8. 6 匹配 变量 





















































我 们 曾经 在 模式 中 使 用 过 括号 ， 使 用 括号 是 














于 它 可 以 将 模式 的 某 一 部 分 组 合 起 来 。 同 时 括号 也 会 引起 正则 表达 式 分 配 新 




















的 内 存 块 。 这 些 内 存 含有 括号 中 的 模式 所 匹配 的 字符 串 。 如 果 有 不 正 一 对 括号 ， 那 就 不 止 一 块 内 存 块 。 每 一 个 内 存 块 内 有 


一 段 字符 串 ， 而 非 模式 的 一 部 分 。 









































由 于 这 些 变量 含有 字符 串 , 那 它们 是 标量 变量 , 在 Pen 中 ,它们 具有 像 $1, $2 这 样 的 名 字 。 变 量 个 数 同 模式 中 括号 对 数 的 个 


数 是 相同 的 。 如 $4 是 指 第 四 对 括号 所 匹配 的 字符 串 争 。 




















急 这 和 后 引用 (backreference)\4 在 模式 匹配 


























引用 字符 的 字符 串 相 同 。 但 它们 不 仅 是 同一 事物 的 两 个 不 同名 字 ; \4 是 模式 正在 匹配 是 引 












































5 





用 的 ， 而 $4 是 模式 匹配 完成 后 再 引用 的 。 





想 了 解 更 多 的 关于 backreferences 的 信息 ， 可 参见 perlre 的 帮助 手册 。 











这 些 匹 配 变量 (match variables) 是 组 成 正则 表达 式 强 大 功能 的 重要 部 分 ， 它 允许 取出 相应 的 字符 串 : 





$_= “Hello there, neighbor ”; 
让 (AsCAw+),/){ 
Print “the word was $l\m”; 


} 





也 可 以 一 次 使 用 多 个 : 





$_= "Hello there, neighbor”; 
if( 人 CAS+) AS+),， (AS+)/){ 
Print“words were $1 $2 $3”; 
} 


其 输出 为 words were Hello there neighbor。 


我 们 感 兴趣 的 部 分 。 
blei@163.com 


# 空 格 和 去 号 之 间 的 词 
#the word was there 





注意 输出 中 没有 和 逗号 。 因 为 第 二 块 内 存 中 没有 喜 号 。 使 用 这 种 技术 ， 可 以 选择 
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匹配 变量 可 能 是 空 的 $， 如 果 其 没有 被 匹配 上 。 也 恕 是 说 ， 匹 配 变量 的 值 可 能 为 空 串 : 























银 这 和 undefined 是 不 同 的 。 如 果 模 式 中 只 有 3 个 或 者 更 少 的 括号 ， 那 944 为 undef。 





my $dino = "Ifear that Tll be extinct after 1000 years. ; 
让 ($dino =~ /Cd*) years/) { 

print "That Said '$1 years\n"; ##1000 
} 


my $dino = "Ifear that IT]l be extinct after a few millions years.; 
让 ($dqino =~ /CAd*) years/) { 

print "That said $1' years.m"; # 空 串 
} 


8. 6. 1 内 存 值 的 保存 


这 些 匹配 变量 的 值 会 保持 不 变 ， 直 到 下 一 个 模式 成 功 匹 配 为 止 儿 。 也 就 是 说 ， 一 个 没有 匹配 成 功 的 模式 将 不 会 改变 内 存 中 
相应 的 值 ， 但 一 个 匹配 上 的 模式 将 重 写 此 内 存 。 这 明确 的 告诉 你 ， 不 要 随意 的 使 用 这 些 变量 ， 除 非 明确 知道 它们 匹配 正确 ; 
香 则 ， 你 可 能 得 到 上 个 模式 匹配 的 结果 。 下 面 的 例子 〈 不 好 的 例子 ) 本 意 是 输出 被 Swilma 变量 匹配 的 字符 串 。 但 如 果 匹 配 
失败 ， 它 将 输出 $1 中 以 前 所 匹配 上 的 字符 串 。 



















































































银 这 里 的 作用 域 规则 相当 复杂 《可 查看 相关 文档 )， 除 非 你 希望 这 些 匹 配 变 量 在 数 行 后 还 被 使 用 ， 和 否则 不 会 有 什么 问题 。 









































$wilma =~ /CAw+)/: # 不 好 ， 没 有 检测 匹配 的 结 


print“Wilma's word was $1... or was it?m2; 








这 也 是 为 什么 模式 匹配 几乎 都 在 让 和 while 循环 的 条 件 判断 出 现 的 原因 : 





让 ($wilma =~ /CAw+)/{ 
Print “Wilma's word was $1.\n2”” 
} else { 
Print“Wilma doesn thave a wordAn ; 


} 























由 于 内 存 中 的 值 不 会 一 直 保留 ， 那 应 当 在 模式 匹配 后 尽快 地 ( 几 行内 ) 使 用 像 $1 这 样 的 变量 。 如 果 维 护 人 员 在 正则 表达 式 和 
使 用 $1 的 表达 式 之 间 加 入 了 新 的 正则 表达 式 ， 那 此 时 $1 的 值 为 第 二 个 匹配 的 结果 ， 而 非 第 一 个 。 由 于 这 个 理由 ， 如 果 要 在 
后 面 使 用 这 个 变量 的 值 ， 应 当 将 其 拷贝 到 普通 变量 之 中 。 这 样 做 同时 也 可 以 使 程序 更 易于 阅读 : 


















































if$wilma =~ /CAw+)/{ 


my $wilma_word = $1; 


} 
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在 第 九 章 ， 你 将 学 习 到 如 何在 模式 匹配 时 直接 将 内 存 中 的 值 存 入 变量 之 中 ， 而 不 需要 明确 的 使 用 $1。 











8. 6. 2 自动 匹配 变量 





























还 有 三 个 匹配 变量 ， 你 可 以 不 花 什 么 代价 的 使 用 它们 争 ， 无 论 这 些 模式 是 否 有 括号 。 这 是 个 好 消息 ;但 同时 ， 这 些 变量 的 
名 字 相 当 古 怪 。 









































急 是 的 。 没 有 完全 免费 的 东西 。 它 们 “免费 ”只 是 说 不 需要 匹配 的 括号 和 而已。 我们 将 在 后 面 讲述 其 花费 的 代价 。 





















































如 果 能 将 这 些 变量 名 取得 简单 一 些 ， 如 $sgazoo，$ozmodiar，Larry 肯定 会 非常 乐意 。 但 在 你 自己 的 程序 中 你 可 能 使 用 这 些 变 
量 名 。 为 了 让 普通 的 Perl 程序 员 在 记 住 Perl 所 有 的 特殊 变量 之 前 能 写 程序 争 ，Larry 将 大 量 Perl 内 蔡 的 变量 名 取得 相当 十 
怪 ， 并 且 不 符合 变量 名 的 命名 规则 。 这 里 提 到 的 三 个 变量 名 为 : $&,$ ,4$'。 它 们 看 起 来 相当 奇怪 ， 但 无 论 怎 样 ， 这 就 是 其 名 
字 争 。 匹 配 上 的 那 部 分 字符 串 将 自动 存储 在 $& 之 中 。 


















































争 同 时 也 应 当 避 免 使 用 像 $ARGYV 这 样 的 变量 ， 但 这 些 极 少数 的 变量 全 是 大 写 的 。Perl 所 有 内 藤 变 量 均 可 在 perlvar 的 帮助 手册 中 找到 。 





























争 如 果 不 喜 欢 这 些 变量 名 ， 你 可 以 使 用 English 这 个 模块 ， 它 试图 将 所 有 Perl 奇怪 的 变量 名 给 与 一 个 普通 名 字 。 但 使 用 这 个 模块 的 人 很 少 。 
相反 的 ，Perl 程序 员 开 始 越 来 越 喜欢 这 这 些 有 标点 符号 的 变量 名 了 ， 管 它 样子 是 否 古 怪 呢 。 
































it(Hello there, neigbor =~ 人 SCw+),/){ 
Print “That actually matched '$& AD”; 


} 











匹配 的 部 分 是 “there,”( 空 格 ， 单 词 ， 和 一 个 喜 号 )。 变 量 $1 中 的 值 为 here， 而 $& 为 整个 被 匹配 的 部 分 。 























匹配 部 分 的 前 一 部 分 存放 在 $ 之 中 ， 后 一 部 分 被 存 到 $ 。 另 一 种 说 法 是 , 全 中 含有 正则 表达 式 引擎 在 匹配 成 功 前 所 找到 的 变 
量 ， 而 $ 为 此 模式 还 没有 匹配 的 剩余 部 分 。 如 果 将 这 三 个 变量 放 在 一 起 ， 你 将 得 到 原始 字符 串 : 








让 (Hello there, neighbor” =~ ASCw+),/){ 
pirnt“That was ($)($&)( 人 7 
} 











输出 的 消息 为 (Hello)(there,)( neighborm)， 为 这 三 个 自动 匹配 变量 的 值 。 三 个 变量 的 值 可 能 是 空 的 ， 和 之 前 数字 匹配 变量 的 例 
子 一 样 。 它 们 和 数字 匹配 变量 有 相同 的 作用 域 。 通 常 ， 在 下 次 成 功 匹配 前 其 值 不 变 。 



























































现在 ， 我 们 讨论 我 们 之 前 说 的 “免费 ”问题 。 是 的 ， 自 由 是 要 代价 的 。 这 里 的 代价 是 ， 如 果 你 使 用 了 这 三 个 自动 匹配 变量 
中 的 任意 一 个 ， 无 论 在 程序 的 什么 地 方 ， 其 它 地 方 的 正则 表达 式 的 运行 数 度 会 变 慢 一 些 。 虽 然 ， 变 慢 的 程度 不 大 ， 但 已 经 
足够 让 人 担忧 ,因此 许多 Perl 程序 员 从 不 使 用 这 些 自动 匹配 变量 争 。 相 反 的 ， 使 用 的 奉 代 的 方法 。 例 如 ， 如 果 需 要 使 用 $&， 
那么 在 整个 模式 上 加 上 括号 ， 并 使 用 $1 代替 。 







































































急 许 多 人 没有 测试 其 程序 的 实际 效率 ， 以 判断 其 替代 方法 是 否 节 约 了 时 间 。 这 些 变量 看 起 来 是 有 害 的 ， 但 我 们 不 因 该 在 实际 比较 过 它们 的 
效率 之 前 而 责备 它们 ， 许 多 程序 从 这 个 三 个 变量 中 获 益 ， 这 些 程序 一 周 只 运行 几 分 钟 ， 优 化 和 评估 其 效率 是 浪费 的 。 但 ， 如 果 我 们 对 一 
毫秒 都 非常 关心 呢 ? 顺便 提 一 句 ，Perl 开发 者 正 着 手 解决 这 一 个 问题 ， 但 在 Perl6 之 前 可 能 都 不 会 有 好 的 答案 。 
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匹配 变量 《自动 的 和 编号 的 ) 经 常 在 需要 替换 的 地 方 使 用 ， 这 在 下 一 章 中 介绍 。 























8. 7 一 般 的 数量 词 


模式 中 的 数量 词 表 示 前 面 项 重复 的 次 数 。 你 已 经 见 过 三 个 数量 词 : % +, ?。 如 果 这 三 个 数量 词 仍 不 能 满足 你 的 要 求 ， 那 可 以 
使 用 花 括 号 ({))， 花 括号 中 有 2 个 数字 ， 由 逗号 隔 开 ， 表 示 前 面 一 项 允许 重复 的 次 数 。 





























模式 /af{$,151/ 将 匹配 5 个 到 15 个 a 中 的 任意 一 个 〈 包 括 $S， 和 15$)。 如 果 a 出 现 了 3 次 ， 则 次 数 太 少 ， 而 不 能 匹配 上 ;如果 
出 现 $ 次， 则 匹配 上 了 :如 果 出 现 10 次 ， 仍 然 匹 配 上 。 如 果 出 现 20 次 ， 仍 将 匹配 上 ， 前 15 个 将 匹配 上 。 

















如 果 省 略 掉 第 二 个 数字 ( 喜 号 留 下 )， 现 在 没有 上 限 了 。 因 此 ， /fred){3,}/ 将 在 一 行 中 有 3 个 或 者 更 多 个 fred 时 匹配 上 (fred 
之 间 不 允许 有 其 它 字 符 ， 包 括 空格 )。 这 里 没有 上 限 ， 因 此 如 果 有 88 个 ffed， 仍 将 匹配 上 。 























如 果 除 了 上 限 数字 外 ， 喜 号 也 被 省 略 了 ， 那 将 匹配 确定 的 次 数 : NAw{8j}/ 将 严格 的 匹配 8 个 word 字母， 数字 ， 下 划 线 ) (可 
能 被 其 中 一 个 长 字符 串 部 分 所 匹配 上 )。/,{5$}chameleon/ 将 匹配 “ ,chmeleon "。 


























前 面 介 绍 过 的 三 个 数量 词 是 简写 形式 。 星 号 ( 鸣 等 同 于 {0,}， 表 示 0 个 或 多 个 。 加 号 (H) 等 同 于 {1,}， 表 示 1 个 或 多 个 。 而 问 
号 @O) 则 等 同 于 {0,1}。 在 实际 程序 中 ， 很 少 使 用 花 括 号 的 数量 词 ， 前 面 介绍 的 三 个 数量 词 (*+,?) 基 本 已 能 应 付 。 









































8. 8 优先 级 


正则 表达 式 中 的 这 些 元 字符 ， 可 能 让 你 觉得 如 果 没有 一 个 表 很 难 记 住 它们 的 关系 。 这 就 需要 一 个 优先 级 的 表 ， 表 明 模式 
哪 一 部 分 应 当 结合 在 一 起 。 这 和 操作 符 的 优先 级 表 有 些 不 同 ， 正 则 表达 式 的 优先 级 表 更 简单 ， 只 有 4 个 级 别 。 本 节 ， 将 
顾 Perl 在 模式 中 使 用 的 所 有 的 元 字符 。 














吾 二 






































1. 在 此 优先 级 表 的 最 顶端 是 括号 : 〈())， 在 分 组 和 引用 内 存 值 的 时 候 使 用 。 括 号 内 部 的 任何 部 分 比 括号 外 的 部 分 结合 更 紧 


恒 























2. 第 二 级 是 数量 词 。 这 里 有 星 号 (9)， 加 号 (+)， 问 号 (? ) 以 及 由 花 括 号 表示 的 数量 词 ， 如 {5,15}, {3, }, {5} 等 。 它 们 通常 
和 前 一 项 元 素 结合 。 





























3. 第 三 级 的 是 销 定 和 序列 (sequence )。 销 定 包 括 (9 表明 字符 串 的 开头 ，( 和 表明 结尾 , (b) 词 界 符 ，CB) 非 词 界 符 。 序 列 〈 一 
个 元 素 紧 接着 一 个 元 素 ) 实际 上 是 一 种 操作 ， 虽 然 它 没有 使 用 元 字符 。 这 段 话 的 含义 是 一 个 单词 中 的 字母 结合 更 紧密 ， 就 
像 锚 定 紧 贴 字母 一 样 。 
4. 优先 级 最 低 的 是 竖 线 ()， 表 示 或 。 由 于 其 优先 级 最 低 ， 它 通常 将 模式 划分 成 儿 个 部 分 。 它 在 优先 级 最 底 端 是 因为 我 们 希 
望 像 Wfredlbarney/ 里 面 的 字母 比 或 0) 结 合 更 紧密 。 如 果 或 4) 的 优先 级 比 序 列 的 优先 级 更 高 ,那么 ， 上 述 模式 的 含义 是 匹配 fre， 
接着 是 d 或 者 b, 然后 是 arney。 因 此 ， 或 () 的 优先 级 最 低 ， 字 母 序 列 的 优先 级 要 高 些 。 




































































除了 优先 级 表 外 ， 还 有 被 称 为 原子 〈atoms) 的 东西 ， 它 们 组 成 模式 最 基本 的 块 。 它 们 是 单个 字符 ， 字 符 类 ， 以 及 后 引用 


(backreference)。 
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8. 8. 1 优先 级 练习 


外 





当 需 要 解析 复杂 的 正则 表达 式 时 ， 你 应 当 像 Perl 那样 使 用 优先 级 表 来 理解 它 。 




















例如 ，/Afredlbarney$/ 很 可 能 并 不 是 程序 员 想 要 的 模式 。 由 于 竖 线 (0) 的 优先 级 最 低 ; 它 将 上 述 模式 分 成 了 两 部 分 。 这 个 模式 
在 或 者 开头 是 fred, 或 者 结尾 是 barney 时 匹配 上 。 很 可 能 程序 员 想 要 的 是 (A(fredlbarney)$ ), 这 将 匹配 只 有 fred 或 者 只 有 barney 
的 行 争 。 那 /(wilmalpebbles?)/ 呢 ? 问号 也 对 前 面 的 元 素 有 效 拿 ， 它 将 匹配 wilma, pebbles， 或 者 pebble， 可 能 是 某 个 长 字符 串 
的 一 部 分 《因为 没有 锁定 )。 












































急 当 然 ， 结 尾 处 可 以 有 换行 符 ， 我 们 在 早期 讨论 $ 锚 定时 提 到 过 。 

















合 因 为 数量 词 和 字母 结合 更 紧密 


























模式 /AQAw+)JNs+(Cw+)$7/ 将 匹配 那些 含有 一 个 “ 词 (word) ”， 一 些 空 和 白 ， 另 一 个 “ 词 (word) ”， 之 外 没有 其 它 符号 的 行 。 
它 将 匹配 上 像 fred flintstone 这 样 的 行 。 模 式 中 的 括号 是 不 需要 的 ， 当 然 它 们 可 以 将 匹配 上 的 字符 串 存 放 在 $1, $2 之 中 。 






































当 解 析 复 杂 的 正则 表达 式 时 ， 括 号 将 有 助 于 你 区 分 优先 级 。 可 以 这 样 做 ， 但 请 记 住 ， 如 果 使 用 了 括号 ， 则 这 些 括号 所 匹配 
的 字符 串 将 放 在 相应 的 内 存 变量 之 中 ($1 $2.. . ) 之 中 。 当 添加 新 的 括号 时 也 可 能 需要 改变 这 些 以 前 的 编号 争 。 






































多 察看 perlre 的 帮助 手册 了 解 更 多 的 不 会 引起 内 存 分 配 的 括号 ， 它 们 仅 是 用 来 分 组 。 


8. 8. 2 更 多 








虽然 已 经 涵盖 了 程序 员 日 常 编程 所 需要 知道 的 正则 表达 式 特性 的 绝 大 部 分 ， 但 还 没 介绍 完 。 还 有 一 些 在 羊 驼 书 中 有 介绍 。 
也 可 以 察看 perlre, perlrequick, 以 及 perlretut 的 帮助 手册 来 了 解 更 多 信息 ， 以 及 Perl 模式 所 能 完成 的 工作 登 。 



































人 查看 CPAN 中 的 YAPE::Regexp::Explain 。 


8.， 9 模式 测试 程序 


现在 ， 程 序 员 已 经 能 够 书写 正则 表达 式 了 ， 虽 然 不 容易 摘 清 此 正则 表达 式 所 能 完成 的 工作 。 通 常 发 现 正 则 表达 式 实 际 匹 配 
的 比 要 求 的 更 多 ， 或 者 更 少 ;或 者 比 预 期 的 更 早 ， 更 晚 ， 或 者 完全 不 匹配 。 



































下 面 的 程序 用 来 测试 一 个 模式 ， 看 它 能 匹配 什么 以 及 在 什么 地 方 匹 配 ; 














#! /usYbin/perl 
while(<>){ # 一 次 取 一 行 输入 
chomp; 


it(UYOUR_PARTTEN_GOES_HERE/){ 
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print “Matched: I$<$&>$'n”# 慰 殊 的 变量 
jelse{ 
print no match: I$_INn”; 


} 

















这 个 模式 测试 程序 是 给 程序 员 用 的 ， 而 非 终 端 用 户 ， 从 它 没 有 提示 信息 这 点 可 以 看 出 。 它 会 将 输入 行 和 模式 
YOUR_PARTTERN_GOES_HERE 进行 比较 。 对 于 任何 匹配 上 的 行 ， 它 使 用 三 个 特殊 变量 ($, $&, $?) 来 指出 是 在 什么 地 方 匹 
配 上 的 。 如 果 横 式 为 /match/， 输 入 为 /beforematchafter/， 你 将 看 到 如 下 信息 :“Matched: lbefore<match>afterP, 尖 括号 标明 匹 
配 上 的 部 分 。 你 能 立刻 看 到 匹配 上 的 行 是 否 是 你 所 希望 的 。 

















8.，10 练习 


参考 答案 在 附录 A 中 。 





其 中 有 几 个 例子 要 求 你 使 用 本 章 的 测试 程序 。 你 可 以 用 它 ， 但 请 注意 这 些 符号 争 ， 不 要 输 错 了 。 











急 如 果 手 工 和 输入 它 ， 记 住 反 引号 (backtick) 字符 () 同 撒 号 (apostrophe) 〈') 是 不 一 样 的 。 在 当今 大 多 数 键盘 上 《至 少 , U.S 键盘 上 ) 反 引 号 
正好 在 数字 键 1 的 左边 























[8] 使 用 模式 测试 程序 。 创 造 一 个 模式 能 匹配 字符 串 match 。 使 用 字符 串 beforematchafter 进行 测试 。 输 出 结果 将 其 三 部 
分 放 在 正确 位 置 了 吗 ? 





上 亚 



































2. [了 7] 使 用 模式 测试 程序 , 创造 一 个 模式 能 匹配 任何 单词 C\w 意义 下 的 单词 ), 但 这 个 单词 必需 以 字母 a 结尾 。 它 匹配 wilma 
而 没 匹 配 barney 吗 ? 它 匹 配 Mrs. Wilma Flintstone 吗 ? wilma&cfred 呢 ? 使 用 前 一 章 习 题 的 文件 进行 练习 〈 如 果 没 有 上 
述 字符 串 ， 则 加 上 它们 ) 
































3. [5 修改 第 二 题 的 程序 ， 使 之 将 由 a 结 尾 的 单词 放 到 $1 之 中 。 同 时 修改 源 代 码 ， 使 此 变量 对 应 的 值 被 放 在 单 引 号 之 中 ， 


如 $1 contains“Wilma'。 











4. [5] 额 外 练习 : 修改 第 三 题 程序 ， 使 之 能 捕捉 由 a 结尾 的 单词 之 后 的 5$ 个 字符 〈 如 果 有 那么 多 )， 并 将 之 放 入 一 个 独立 
变量 中 。 例 如 ， 如 果 输 入 的 是 Isaw Wilma yesterday， 则 紧 接 的 $ 个 字符 是 yest〈 前 有 空格 )。 如 果 输 入 是 工 Wilmal， 
则 具有 一 个 字符 。 它 现在 还 能 匹配 wilma 吗 ? 






























































比 
SN 


5.， [5] 写 一 个 程序 〈 不 是 测试 程序 )， 能 输出 任何 由 空白 结尾 的 输入 行 〈 非 换行 符 )。 在 输出 的 结尾 处 放置 一 个 标记 符 ， 使 
之 能 标记 出 空白 。 
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第 九 章 使 用 正则 表达 式 处 理 文件 




















可 以 通过 正则 表达 式 来 改变 文本 。 到 目前 为 上 上， 只 介绍 过 怎么 匹配 模式 。 现 在 ， 我 们 将 向 你 演示 怎样 通过 模式 来 改变 字符 
串 中 相应 地 部 分 。 


9. 1 使 用 sW/ 进 行 替换 





如 果 将 mw 这 个 模式 匹配 看 作 同 文字 处 理 器 的 “查询 〈search) ” 尖 似 的 功能 ， 那 Perl 中 s W/ 操 作 的 则 类 似 于 :查询 并 替换 
Csearch and replace) ”。 它 将 奉 换 变量 中 银 模 式 所 匹配 上 的 部 分 : 

















争 同 my/ 不 一 样 ，m/ 可 以 和 任何 字符 串 表 达 式 进行 匹配 ，sW 只 能 修改 被 称 为 左 值 (lvalue) 的 数据 。 这 通常 是 一 个 变量 ， 昌 然 它 可 以 是 任 
何 可 在 赋值 符 左 侧 出 现 的 东西 。 














$_=“He's outbowling with Barney tonight.”; 


SBarney/Fred/; #Barney 被 Fred 替换 掉 
print “$_\n”; 











如 果 没 有 匹配 上 ， 则 什么 也 不 会 发 生 ， 此 变量 也 不 会 有 任何 更 改 : 





# 接 上 例 : 现在 $_ 为 “He's out bowling with Fred tonight.” 
S/Wilma/Betty/; # 用 Wilma 蔡 换 Betty 〈 失 败 ) 


模式 和 被 奉 换 的 字符 串 可 能 更 复杂 。 下 例 中 ， 替 换 的 字符 串 使 用 了 变量 : $1， 其 值 由 模式 匹配 所 赋值 : 

















S/with CAw+)/agaist $17s teamy/; 
print“$_\n”; # 为 “He's out bowling against Fred's team tonight” 








下 面 还 有 些 其 它 可 能 的 替换 方法 。( 它 们 在 这 














只 是 作为 例子 出 现 。 在 实际 代码 中 ,很 少 在 一 行 中 做 这 么 多 不 相关 的 替换 。) 

















$_= “green Scaly dinosaur ; 
SCAw+) (w+)/$2, $1/; # 现 在 为 “scaly, green dinosaur”; 
S/MWhuge, /; # 现 在 为 “huge, scaly, green dinosaur， 
S/,.*eenV//; # 宝 替换 ,现在 为 “huge dinosaur” 
S/green/red/; # 匹 配 失败 ,仍然 为 “huge dinosaur” 
SAwW+$/($ 0D$& /; # 现 在 为 “huge (huge !)dinosaur” 
S/AS+(I\W+)]/$1 /; # 现 在 为 “huge (hugel) dinosaur， 
shuge/gigantic/; # 现 在 为 “gigantic (hugeD dinosaur” 
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sW/ 会 返回 一 个 Boolean 值 。 如 果 成 功 蔡 换 则 返回 true; 否则 返回 false: 


$_ = 'fred flintstone7 
if(s/fred/wilma/){ 


Print “Successfully replaced fred with wilmalNn ; 


} 


9. 1. 1 使 用 /g 进行 全 局 替换 




















在 前 面 的 例子 中 你 可 能 已 经 注意 到 ，s 值 进行 一 次 替换 ， 无 论 是 否 还 有 地 方 还 能 匹配 上 。 当 然 ， 这 只 是 默认 的 行为 。 修 饰 
符 /g 要 求 sW/ 将 不 相 重 全 争 的 所 有 匹配 上 的 部 分 都 进行 奉 换 : 

















镶 它 是 不 相 重 县 的 ， 因 为 每 一 次 新 的 匹配 都 是 从 最 近 匹 配 成 功 的 地 方 之 后 开始 进行 的 。 











$_ = “home, Sweet home!”; 
SAhome/cave/g; 


print“$_ \n”; #“cave, SWeet cave 人 ; 














全 局 替换 的 一 个 常用 地 方 是 将 多 个 空格 用 单个 空格 替换 掉 : 








$_=“Iput datavtmay have extra whitespace.”; 


SAS+/ /g; # 现 在 是 “Input data may have extra whitespace.” 





现在 已 经 知道 怎样 去 掉 多 余 的 空格 ， 那 怎样 去 掉 开 头 和 结尾 的 空白 呢 ? 这 是 非常 容易 的 : 





SAANS+//; # 将 开头 的 空白 去 掉 
SAAs+$/; # 将 结尾 的 空白 去 掉 


我 们 可 以 使 用 /g， 只 用 一 步 来 完成 ,， 但 这 可 能 影响 效率 ， 至 少 在 我 们 写作 此 书 时 是 这 样 。 正 则 表达 式 通常 是 可 被 优化 的 ， 
想 了 解 更 多 的 信息 ， 可 以 参看 《掌握 正则 表达 式 》(Mastering Regular Expressions) (O'Reilly)， 其 中 有 关于 如 何 使 正则 表达 式 
更 快 (或 者 更 慢 ) 的 讨论 。 




















S/AS+INs+$/g; # 将 开头 ， 结 尾 的 空白 去 摊 








9. 1. 2 不 同 的 分 隔 符 





如 同 mW 和 qw/ 一 样 ， 我 们 也 可 以 改变 8 的 分 隔 符 。 但 这 里 使 用 了 3 个 分 隔 符 ， 因 此 有 些 不 同 。 




















通常 的 〈 非 配对 的 ) 字符 ， 由 于 没有 左 字符 和 右 字符 的 区 别 ， 则 可 以 像 使 用 正 斜 线 () 那 样 使 用 。 如 ， 使 用 井 号 〈#) 多 作 为 
分 隔 符 ; 
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急 这 里 ， 我 们 需要 向 我 们 的 英国 的 朋友 道 铭 ， 因 为 井 号 才 ( 在 英语 中 # 号 的 单词 时 pound, 有 磅 的 含义 ， 译 者 注 ) 对 于 他 们 有 别 的 含义 。 昌 然 井 
号 在 Perl 中 也 表示 注释 的 开始 ， 但 在 替换 (s) 之 后 ， 由 于 Perl 期 望 一 个 分 界 符 ， 因 此 不 会 将 # 号 当 作 注 杰 的 提示 符 处 










































































S#^https://#http://#; 














TH 





如 果 使 用 的 是 配对 的 字符 ， 也 就 是 说 其 左 字符 和 右 字 符 不 的 ， 则 必需 使 用 两 对 : 一 对 存放 模式 ， 一 对 存放 蔡 换 的 字符 串 。 
此 时 ， 分 隔 符 甚 至 可 以 是 不 同 的。 事实 上 ， 分 隔 符 还 可 以 使 用 普通 的 符号 〈 非 配对 的 )。 下 面 三 例 是 等 价 的 ; 


























sffred}{barney)}; 
s[fred](barney); 
S<fred>#barney#; 


3 可 选 的 修饰 符 








除了 /g 修饰 符 外 争 ， 替 换 操 作 中 还 可 以 使 用 让 /xx， 和 人 A， 这 些 在 普通 的 模式 匹配 中 已 经 出 现 过 的 修饰 符 。 其 顺序 是 无 关 紧 


要 的 。 

















镶 我 们 这 里 所 说 的 是 像 %i" 这 样 的 修饰 符 ， 但 分 隔 符 有 可 能 不 是 /。 








Ss#wWilma#VWVilma#gi; # 将 所 有 的 WilmA, 或 者 WILMA 等 等 ， 由 Wilma 替换 掉 
sf{__END__ .*}{f 1s; ## 和 END 标记 及 其 后 面 的 行 去 掉 





9. 1. 4 绑 定 操作 








同 mV/ 一样， 我 们 也 可 以 通过 使 用 绑 定 操作 符 改 变 8W 的 蔡 换 目标 ; 

















立 


$file_name =~ S# 人 .#####S， # 舒 $file_name 中 所 有 的 Unix 类 型 的 路 径 去 掉 


9. 1. 5 大 小 写 转换 





有 时 ， 和 希望 确保 被 蔡 换 的 字符 串 均 是 大 写 的 《或 者 不 是 ， 视 情况 而 定 )。 这 在 Perl 中 只 需 使 用 某 些 修饰 符 就 能 办 到 。\U 要 
求 芭 接着 的 均 是 大 写 : 











$_='“Isaw Barney with Fred.”; 
s/(fredlbarney)AU$1/gii #_ 现在 是 “Isaw BARNEY with FRED.” 


同样 ， 也 可 以 要 求 后 面 的 均 为 小 写 : \L: 


s/(fred)lbarneyAL$1/gi; 孝 _ 现 在 是 “Isaw barney with fred.” 
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默认 时 ， 


会 影响 到 剩余 的 〈 蔡 换 的 ) 





S/CAw+) with CCw+)AU$2AE with $1/E 





| 





使 


崩 小 写 形 式 时 CAl 和 \u)， 


S/ (fredlbarney)NAu$l/ig; 





也 可 以 同时 使 月 


急 开 和 \u 可 以 按 任意 顺序 出 现 。Larry 意识 到 人 们 有 时 可 能 按 相 反 顺 序 使 用 它们 ， 因 此 他 将 Perl 设计 成 ， 在 这 两 种 情况 下 都 是 将 第 





昌 它 们 。 如 使 有 


只 作用 于 下 一 个 


二 


了 和 何 : 
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字符 串 。 可 以 使 用 民 来 改变 这 种 影响 : 


考 ] 现在 是 “saw FRED with barney” 


示 _ 现 在 是 工 saw FRED with Barney.” 


























母 大 写 ， 其 





s/(fredlbarney)AuNL$Lig; 


这 些 在 替换 中 出 现 的 大 小 写 转换 的 修饰 符 ， 也 可 在 双 引 号 中 使 用 : 


有 u 和 NL 表示 “第 


余 的 小 写 。Larry 是 个 非常 好 的 人 。 





个 字母 大 写 ， 其 它 字 母 均 小 写 ” 多 : 

















郁 _ 现 在 为 “Tsaw Fred with Barney.” 








print“Hello,\LNu$nameME, would you like to play a game2n”; 


9. 2split 操作 





另 一 个 使 用 正则 表达 式 的 操作 是 split， 它 根据 某 个 模式 将 字符 串 分 割 开 。 这 对 于 由 制 表 符 分 割 开 ， 
开 ， 或 者 任意 字符 分 割 j 











于 的 数据 是 非常 有 有 














区 
| 











目 
































符 〈separator) 的 地 方 ， 均 可 用 split。 其 形式 如 下 : 


合 不 包括 “comma-separated values 〈 喜 号 分 制 j 


中 的 Text: 


CSV 模块 





@fields = split /separtor/, $string; 





split 争 将 模式 同 
新 匹配 的 开始 。 





镶 它 是 一 个 操作 ， 虽 然 其 行为 很 像 函 数 ， 通 常 每 一 个 人 都 认为 它 是 一 个 函数 。 但 其 


Q@fields = Split//，abc:def:g:h”; 


可 能 得 到 空 的 元 素 ， 如 果 其 中 有 两 个 分 隔 符 是 


Q@fields = Split /:/，abc:def::g:P”; 





题 。 
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字符 串 ; 
因此 ， 














行 比较 ， 将 
任何 匹配 模式 的 部 分 均 不 会 在 返回 值 中 出 现 。 下 




















于 的 数据 )” 





工 


开头 的 空 元 素 会 被 返回 ， 但 结尾 的 空 元 素 被 于 弃 争 。 虽 然 第 一 次 见 到 时 看 起 来 有 些 古 怪 ， 























一 般 被 称 作 CSV 文件 。 





使 


















































技术 上 的 区 别 超出 了 本 书 讨论 的 范围 。 





# 返 回 (abc7” “def，， 相 1 


# 得 到 (abc”， “def” 人 了 祭 人 





1127201 


号 分 割 开 ， 空 白 分 咱 
上 的 作 。 任 何 可 在 正则 表达 式 之 中 《通常 ， 是 一 个 简单 的 正则 表达 式 ) 指定 分 离 


旦 很 





一 


用 split 对 它 处 理 是 非常 痛苦 的 ， 最 好 利用 CPAN 


分 离 符 所 分 隔 开 的 子 串 作为 列表 返回 回来 。 当 模式 匹配 上 ， 既 是 此 次 匹配 结束 ， 和 
硬是 一 个 典型 的 split 操作 ， 由 冒号 分 开 : 


少 引起 问 


9/21/2006 
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急 这 仅 是 默认 的 行为 ， 是 基于 效率 方面 的 考虑 。 如 果 担 忧 丢失 了 结尾 的 空 元 素 ， 可 以 使 用 split 的 第 三 个 参数 : -1。 请 参阅 perlfunc 的 帮助 
手册 。 


@@ 有 ads 三 | 大全 各 到 《人 











赔 
下 
疏 
人 
咱 
世 
全 
起 
欧 


使 用 空白 As+/ 这 个 模式 进行 分 割 是 非常 常见 的 。 在 这 个 模式 下 ， 所 有 的 

















my $some_input = “This is ax\t test\n ; 
my @args = Split As+/, $ome_input; 捧 ( Tas “二 “2 “他 由”) 





默认 时 ，split 对 $_ 操作， 模式 为 空白 : 


my @fields = split; # 同 split As+/, $_; 








这 同 使 用 模式 As+/ 基 本 上 是 一 样 的 ， 除 了 ， 开 头 的 空 元 素 被 丢弃 。 因 此 ， 如 果 某 行 由 空白 开头 ， 则 它们 将 不 会 出 现在 返回 
的 列表 中 之 中 《如 果 想 得 到 同 以 空白 为 分 离 符 的 split 操作 相同 的 结果 ， 可 在 模式 的 部 分 使 用 单个 的 空格 : split  ”， 
$other_string。 使 用 空格 而 非 模式 ， 是 另 一 种 特殊 类 型 的 split 操作 )。 









































通常 ，split 所 使 用 的 模式 同 这 里 出 现 的 一 样 简单 。 但 如 果 模 式 变 得 复杂 时 ， 那 应 避免 在 模式 中 使 用 括号 。 请 参阅 perlfunc 
以 了 解 更 多 的 信息 争 。 


























争 你 可 能 需要 察看 perlre 的 帮助 手册 中 关于 什么 情况 下 括号 只 是 起 到 分 组 作用 的 信息 。 





9. 3join 函数 


join 函数 不 使 用 模式 ， 但 它 完成 同 split 相反 的 操作 : split 将 一 个 字符 串 分 割 开 ， 而 join 函数 将 这 些 分 割 的 部 分 组 合成 一 个 
整体 。join 函数 类 似 于 : 

















Imy $result = join $glue, @Ppieces; 





join 函数 的 第 一 个 参数 是 粘 合 元 素 (glue)， 它 可 以 是 任意 字符 串 。 剩 下 的 参数 是 要 被 粘 合 的 部 分 。join 将 粘 合 元 素 添 加 在 这 
些 部 分 之 间 ， 并 返回 其 结果 : 














my $x = join “2”, 4, 6, 8, 10, 12; 考 X 为 对 :6:8:10:12?” 





在 本 例 中 ， 我 们 有 五 个 元 素 ， 因 此 有 4 个 冒号 或 者 说 粘 合 元 素 。 这 些 粘 合 元 素 上 只 在 这 些 粘 合 部 分 之 间 出 现 ， 而 不 会 在 之 前 
或 之 后 出 现 。 因 此 烙 合 的 元 素 要 比 粘 合 的 部 分 的 个 数 少 1 。 














这 意味 着 如 果 列 表 中 元 素 个 数 小 于 2， 则 不 会 有 粘 合 的 元 素 : 





my $y = join “foo”，“bar”; # 得 到 “bar” 
my @empty; # 空 数组 
my $empty = join “baz”，@empty; # 没 有 元 素 ， 因 此 为 空 串 
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使 用 上 面 的 gx， 我 们 可 以 先 将 一 个 字符 串 分 割 开 ， 再 使 用 不 同 的 分 陋 符 〈 烙 合 元 素 ) 将 它们 重组 起 来 : 











my @values = Split /:/, $x;  #@values 为 (4, 6, 8, 10, 12) 
my $z =join “2 @values; ”还 z 为 “4-6-8-10-12?” 








split 和 join 可 以 一 起 使 用 ， 但 不 要 筷 了 join 的 第 一 个 参数 是 字符 串 ， 而 非 模 式 。 


9. 4 列表 上 下 文中 的 mW 


当 使 用 split 时 ， 模 式 指定 了 分 离 符 ;这 一 部 分 不 是 有 用 的 数据 。 有 时 指定 要 保留 的 部 分 更 容易 。 























在 列表 context 中 使 用 模式 匹配 (nm/) 时 ， 如 果 匹配 成 功 返 回 值 为 内 存 变 量 值 的 列表 ， 如 果 匹 配 失败 则 为 空 列表 ; 








$_=“Hello there, neighborl”; 
my($first, $second, $third) =/QS+) AS+)， CS+)/; 
print“$second is my $thirdqn”” 





这 种 方法 使 我 们 可 以 给 这 些 匹 配 的 变量 以 合适 的 名 字 ， 这 些 值 不 会 由 于 下 次 模式 匹配 而 被 覆盖 〈 由 于 代码 中 没有 =~, 模 式 会 
自动 〈 默 认 行 为 ) 和 $_ 进 行 匹 配 ) 














在 /中 介绍 的 /g 修饰 符 也 可 在 m/ 中 使 用 ， 它 允许 你 在 字符 串 中 的 多 处 进行 匹配 。 在 这 
次 匹配 成 功 时 返回 其 内 存 中 所 存放 的 值 : 











， 由 括号 括 起 来 的 模式 将 在 每 一 









































my $text = "Fred dropped a $ ton granite block on Mr Slate”; 
my @words = ($text =~ /([a-z]+)/ig); 

Print “Result: @wordsn ; 

#Result: Fred dropped a ton granite block on MIT slate 


这 同 使 用 split 有些 类 似 。 这 里 不 是 指定 我 们 要 去 掉 的 部 分 ， 而 是 指定 我 们 要 保留 的 部 分 。 








如 果 有 不 止 一 对 括号 ， 每 一 次 返回 不 正 一 个 字符 串 。 例 如 将 字符 串 放 入 hash 中 ， 如 下 : 





my $data = "了 Barney Rubble Fred Flintstone Wilma Flintstone”; 
my 2%1last_name = ($data =~ / CCw+)NS+Cw+)/g); 








每 当 模 式 匹 配 成 功 时 ， 将 返回 一 对 值 。 这 些 一 对 一 对 的 值 加 成 了 hash 中 的 key/value 对 。 














9. S$ 更 强大 的 正则 表达 式 


通过 这 三 章 对 正则 表达 式 的 学 习 ， 你 已 经 知道 了 它 的 强大 功能 。 正 则 表达 式 在 Perl 中 处 于 核心 地 位 。Perl 开发 者 还 添加 了 
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更 多 的 功能 ， 本 节 中 你 将 了 解 其 中 最 重要 的 部 分 。 同 时 你 将 学 习 到 一 些 关 于 正则 表达 式 引 擎 的 内 部 操作 。 


9. 5. 1 非 贪 焚 的 数量 词 


已 经 出 现 过 的 四 个 数量 词 〈 在 第 七 章 和 第 八 章 ) 均 是 贪 焚 的 。 这 就 是 说 它们 将 最 大 限度 的 匹配 ， 而 非 节 




















E 匹 配 成 功 时 即 立 刻 


返回 。 下 面 是 一 个 例子 : 假设 在 fred and barney went bowling last night 上 使 用 /fred.+barney/ 进 行 匹 配 。 我 们 知道 正则 表达 式 
子 模式 fred 将 匹配 其 对 应 的 字符 串 。 模 式 的 下 一 部 分 是 .+， 它 将 匹 


ae 





配 除了 换行 符 之 外 的 作 


各 匹配 上 ， 下 面 我 们 有 具体 的 讲解 这 一 个 过 程 银 。 首 先 ， 
F 意 字符 ， 次 数 大 于 等 于 一 。。 但 ， 由 






































于 加 号 (H) 是 贪 楚 的 ， 它 将 尽 可 能 的 进行 匹配 。 因 此 ， 它 将 匹配 




















剩余 的 所 有 字符 串 ， 包 括 night。 这 可 能 让 你 惊奇 ， 但 故事 还 没 结束 。) 









































急 正 则 表达 式 引 擎 作 了 一 些 优化 ， 真 实情 况 和 我 们 这 里 讲述 的 有 些 不 同 ， 这 些 优化 随 Perl 的 不 同 版 本 而 可 能 不 同 。 但 也 不 能 说 其 操作 过 程 











和 我 们 这 里 讲述 的 不 同 。 想 了 解 其 





现在 对 banrey 进行 匹配 ， 但 不 能 成 功 ， 因 为 已 经 到 了 












































ev 


字符 虽 





具体 的 操作 过 程 ， 请 阅读 最 新 的 源码 。 注 意 给 你 发 现 的 bug 提交 补丁 。 























它 退回 字符 串 最 后 一 个 字母 t《〈 它 虽 是 贫 禁 的 ， 但 更 希望 整个 模式 能 匹配 成 功 。) 

















子 模式 barney 又 尝试 匹配 ， 结 果 仍 是 不 行 。 因 此 .+ 


























符 ， 直 到 其 退回 了 字符 串 barney。 最 后 ， 子 模式 banrey 被 匹配 上 了 ， 现 在 整个 模式 都 匹配 上 了 。 











正则 表达 式 引 擎 有 大 量 的 像 上 面 那样 的 




















的 结尾 处 。 由 于 .+ 在 少 一 个 字符 的 情况 下 仍 能 匹配 成 功 ， 因 此 





于 退回 字母 hb， 又 进行 匹配 。 一 个 字符 接 一 个 字符 ，+ 退 回 其 匹配 的 字 


回 退 〈backtracking) 操作 ， 尝 试 每 一 种 可 能 ， 直 到 成 功 或 者 根本 不 能 匹配 为 止 争 。 





如 本 例 所 显示 的 那样 ， 这 些 操作 引起 了 大 量 的 回 退 操作 ， 因 为 这 些 数量 词 匹配 了 太 多 的 字符 串 ， 正 则 表达 式 引 擎 强迫 它们 








返回 一 些 。 


急 有 





此 
有 能 匹配 模式 的 字符 串 ， 纪 





正则 表达 式 引 擎 历 采 用 的 方法 不 同 ， 一 旦 匹配 上 则 ; 
























































行 下 一 项 的 匹配 。 但 Perl 的 正则 表达 式 引 擎 更 关心 模式 是 否 [ 





5 配 ， 因 此 找到 所 


























擎 工作 才 算 完成 。 请 参看 Jeffy Friedl's 的 书 《掌握 正则 表达 式 》 (Mastering Regular Expressions)(O?Reilly)。 


因此 对 于 每 一 个 贪 禁 的 数量 词 ， 需 要 一 种 非 贪 林 的 方法 。 不 是 使 用 加 号 (+), 而 是 使 用 非 贫 禁 的 数量 词 +?， 它 将 匹配 一 次 或 


多 次 〈 加 号 的 意思 )， 但 其 匹配 











又 一 次 ，barney 不 能 匹配 


式 匹 配 成 功 。 


这 里 也 存在 一 些 回 退 操作 ， 但 由 于 引擎 只 需 回 退 ， 并 只 尝试 儿 次 ， 其 在 速度 上 会 有 很 大 提高 
在 fred 的 附近 能 被 找到 。 如 果 数 据 中 fred 在 字符 串 的 3 

















首先 ，fred 将 被 匹配 上 。 接 着 ， 模 式 的 下 一 部 分 是 .+?， 它 匹配 的 字符 个 数 不 大 于 1， 因 此 匹配 fred 后 面 的 空格 。 下 一 个 子 
模式 是 banrey， 它 在 这 里 不 能 被 匹配 〈 因 为 现在 的 位 置 是 and barney.… 的 开头 )。.+? 再 匹配 a， 剩 下 的 模式 继续 进行 匹配 。 


上 ， 因 此 .+? 再 匹配 n， 依 次 类 推 。 当 .+? 匹 配 了 这 5 个 字符 后 ，barney 可 以 被 匹配 上 了 ， 现 在 模 



































则 表达 式 的 速度 依赖 于 具体 的 数据 。 





























民 可 能 少 的 次 数 ， 而 非 尽 可 能 多 的 次 数 。 现 在 我 们 来 看 看 模式 为 /fred.+?barney/ 时 的 过 程 。 



























































。 但 ， 这 种 提高 依赖 于 banrey 





开头 ， 而 barmey 在 结尾 处 ， 则 贪 焚 数 量词 方法 的 速度 更 快 。 因 此 ， 正 











非 贪 焚 数 量词 不 仅 和 效率 相关 。 即 便 它 和 其 对 应 的 贪 禁 数 量词 表达 式 均 能 匹配 〈 或 者 不 能 匹配 ) 同一 个 字符 串 ， 它 们 匹配 
的 部 分 也 可 能 是 不 同 的 。 例 如 ， 假 设 你 有 一 些 HTML 类 型 的 文本 ， 你 想 移 除 标记 <BOLD> 和 </BOLD>， 








内 容 。 下 面 是 文本 : 
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镶 我 们 不 能 使 用 真实 的 HTML， 因 为 通过 简单 的 正则 表达 式 不 能 对 其 进行 解析 。 如 果 想 对 HTML 或 者 某 种 简单 的 标记 语言 进行 解析 ， 使 用 模 
块 来 处 理 更 加 恰当 。 








Tamtalking about the cartoon with Fred and <BOLD>Wilma</BOLD>! 








下 面 是 一 种 移 除 标记 的 方法 。 它 有 什么 错误 呢 ? 














s#<BOLD>(. 交 </BOLD> 示 1#g; 





其 问题 出 在 星 号 是 贫 禁 的 争 。 如 果 文 本 变 成 了 下 面 的 样子 ， 会 得 到 什么 结果 ? 



































急 还 有 另 一 个 问题 : 我 们 不 得 不 使 用 As 修饰 符 ， 因 为 结束 的 标记 可 能 和 开始 的 标记 不 在 同一 行 。 幸 好 我 们 这 里 只 是 练习 ; 在 实际 代码 中 ， 
最 好 使 用 模块 。 
































Ithought you Said Fred and <BOLD>Yelma</BOLD>, not <BOLD>Wilma</BOLD> 


此 时 ， 模 式 将 匹配 从 第 一 个 <BOLD> 到 最 后 一 个 </BOLD> 之 间 的 内 容 ， 中 间 的 部 分 被 保留 下 来 。 噢 ! 我 们 需要 非 贪 禁 的 数 
量词 。 星 号 的 非 贪 禁 的 类 型 是 *2?， 因 此 此 模式 应 当 是 ; 





$#<BOLD>(.*?)</BOLD> 孝 1#g; 


现在 它 能 正确 执行 了 。 











由 于 加 号 的 非 贪 禁 类 型 是 +?， 星 号 的 为 *?， 你 可 能 已 经 意识 到 剩 下 的 两 种 数量 词 其 对 应 的 类 型 也 是 类 似 的 。 花 括号 的 非 
贪 焚 类 型 看 起 来 一 样 ， 只 是 在 闭 花 括号 后 有 一 个 问号 ， 如 {1$,10}? 或 者 {8,}? 争 。 甚 至 问号 数量 词 也 有 非 贪 焚 类 型 : ??。 它 匹 
配 一 次 或 者 0 次 ， 但 倾向 于 匹配 0 次 。 





















































合理 论 上 ， 对 于 单个 的 数字 ， 也 应 有 非 贪 焚 类 型 ， 如 {3}2。 由 于 它 是 指 匹配 前 面 一 项 3 次 ， 则 没有 任何 意义 说 其 是 贪 禁 或 者 非 贪 禁 的 。 
































9. 5. 2 匹配 多 行文 本 





通常 ， 正 则 表达 式 是 针对 单行 文本 的 。 由 于 Perl 可 以 处 理 任意 长 度 的 字符 串 ， 因 此 ，Peal 的 模式 可 以 轻易 的 对 多 行文 本 进 
行 匹 配 ， 就 像 单 行文 本 一 样 。 当 然 ， 表 达 式 中 应 当 包 含 多 行文 本 。 下 面 的 字符 串 中 有 4 行 : 


























$_=“ 江 ammuch bettennthan Barney is\nat bowling\nwWilma An”; 





销 定 ^ 和 $ 是 指 整个 字符 串 的 开头 和 结束 (参阅 第 八 童 )。 但 mm 这 个 正则 表达 式 选 项 允许 它们 根据 内 部 的 换行 符 进 行 匹 配 (将 
m 看 作 多 行 〈think m for multiple lines))。 这 时 锚 定 针对 每 一 行 ， 而 非 整个 字符 串 。 因 此 ， 这 个 模式 可 以 匹配 上 : 








Print“ Found wilma' at start of lne\n” 让 /AwilmaNb/inm; 





同样 的 ， 在 多 行 字符 串 中 ， 也 可 以 分 别针 对 单行 进行 殖 换 。 在 下 面 的 例子 中 ， 我 们 将 整个 文件 读 入 一 个 变量 之 中 争 ， 然 后 
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将 文件 名 字 加 在 每 一 行 的 开头 处 : 
镶 希 望 它 很 小 。 我 们 指 的 是 文件 ， 而 非 变量 名 。 
open FILE, $filename 
Or die“Can't open '“$filename”: $!”; 


my $lines = join , <FILE>; 
$lines =~ S 人 /VSfilename: /gm 


9. 5. 3 更 新 大 量 文件 








更 新 文件 最 常用 的 方法 是 写 一 个 和 以 前 的 文件 相似 的 新 文件 ， 我 们 可 以 根据 的 需要 进行 修改 。 如 你 所 知 ， 这 和 对 同一 个 文 
件 上 进行 更 新 的 结果 类 似 ， 但 上 述 方法 有 一 些 副 作用 。 



































本 例 中 ， 我 们 有 相似 格式 的 上 百 个 文件 。 其 中 一 个 是 fred03.dat， 如 下 : 











Promram name: granite 
Author: Gilbert Bates 
Company: RockSoft 
Department: RD 
Phone: +1 303 935-0095 
Date: Tues March 9, 2004 


Version: 2.1 
Size:21K 
Status: Final beta 














我 们 希望 修改 这 个 文件 ， 使 之 含有 不 同 的 信息 。 下 面 是 我 们 希望 修改 后 它 所 呈现 的 样式 : 














Program name: granjte 
Author: Randal LL. Schwartz 
Company: RockSoft 
Department: RCD 

Date: June 12, 2008 6:38 pm 
Version: 2.1 

Size: 21K 

Status: Final beta 


简 言 之 ， 我 们 需要 在 3 个 地 方 进行 修改 。 作 者 〈Author) 的 名 字 需 要 更 改 ， 日 期 Date) 需 要 更 新 ， 电 话 〈Phone) 需要 删除 。 
我 们 需要 在 上 百 个 这 样 的 文件 中 作 这 些 修改 。 








Perl 可 以 通过 尖 括 号 操作 符 (<>) 对 文件 进行 修改 。 下 面 程序 能 完成 我 们 希望 的 工作 ， 虽 然 第 一 次 看 时 ， 不 是 很 明显 。 这 个 
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程序 只 有 一 个 新 的 特性 : 特殊 变量 $^I;， 现在 可 以 不 用 管 它 ， 我 们 将 在 后 面 讨论 : 








#! /usr/bin/perl --W 


Use Strict; 


chomp(my $date = “date”); 
$AI 和 “bak”， 


while(<>){ 
SAuthor:.*/Author: Randal L. Scharwartz/; 
S 人 /APhone:.xAn//; 
S/ADate:.*/Date: $dqate/; 
Print; 


} 



































于 需要 当前 的 日 期 ， 因 此 在 程序 开端 使 用 了 系统 命令 : date。 另 一 种 获得 时 间 的 更 好 的 方法 是 〈 格 式 有 些 不 同 ) 使 用 Penl 
自 带 的 localtime 函数 ， 其 在 标量 context 中 使 用 : 











my $date = localtime; 


下 一 行 是 给 $^I 赋值 ， 我 们 现在 不 讨论 它 。 








根据 我 们 现在 所 知 的 ， 上 述 操作 的 结果 是 文件 中 新 修改 的 部 分 被 输出 到 终端 ， 内 容 快速 滩 动 ， 但 文件 本 身 不 会 被 修改 。 

















尖 括 号 操作 〈<> ) 所 得 到 的 文件 列表 来 源 于 命令 行 。 主 循环 读 入 ， 更 新 ， 输 出 每 一 行 。( 根 据 我 们 现在 所 知 的 ， 上 述 操作 
的 结果 是 文件 中 被 修改 的 部 分 被 输出 到 终端 ， 这 些 内 容 快速 滚动 ， 但 文件 本 身 不 会 被 修改 。) 第 二 个 奉 换 操作 将 含有 电话 
(phone) 号 码 的 整 行 由 空 串 替 换 ， 连 换行 符 一 起 蔡 换 掉 。 这 行 输出 时 ， 什 么 也 不 会 出 现 ， 就 像 电话 (Phone) 号 码 从 没 存在 过 一 
样 。 还 有 大 量 的 行 不 会 被 这 三 个 模式 所 匹配 ， 他 们 在 输出 时 不 会 有 任何 更 改 。 














































































































结果 接近 于 我 们 所 期 望 的 了 ， 除 了 还 不 知道 怎样 将 更 新 的 信息 写 回 文件 。 答 案 是 变量 $^I。 默 认 时 为 undef， 此 时 没有 什么 
特殊 的 地 方 。 但 给 它 设置 某 些 串 时 ， 它 使 尖 括 号 操作 (<>) 变 得 有 些 特殊 。 




















我 们 知道 尖 括 号 CC>) 的 神奇 特点 : 如 果 没 有 指定 文件 名 ， 则 其 从 标准 输入 流 中 自动 打开 和 关闭 一 系列 文件 进行 读 入 。 但 如 
果 $^I 中 有 字符 串 ， 这 个 字符 串 则 会 成 为 备份 文件 的 扩展 名 。 我 们 在 下 面 仔细 讨论 。 


























我 们 假设 此 时 尖 括 号 (<>) 打 开 的 文件 是 fred03.dat。 它 像 以 前 那样 打开 它 ， 但 进行 了 重 名 名 ， 把 它 叫 做 fred03.dat.bak 争 。 这 
很 好 ， 因 为 不 在 使 用 之 前 的 名 字 。 现 在 <> 将 这 个 新 的 文件 作为 默认 的 输出 ， 因 此 任何 内 容 将 输出 到 那个 文件 中 争 。while 
循环 会 从 旧 的 文件 中 读 入 一 行 ， 更 新 它 ， 再 把 它 输出 到 新 文件 中 。 在 一 台 普通 的 机 器 上 运行 这 个 程序 ， 几 秒 钟 就 能 更 新 上 
百 个 文件 。 非 常 强大 ， 不 是 吗 ? 


























耳 












































镶 过 程 的 细节 之 处 ， 在 不 同 的 non-Unix 可 能 有 所 不 同 ， 但 结果 几乎 是 一 样 的 。 阅 读 移植 到 你 的 系统 中 Perl 的 发 布 须知 (release notes)。 


























; 例如 ， 如 果 以 前 的 文件 是 全 局 可 读 的 (world-readable)， 则 新 文件 也 应 当 是 全 局 可 读 的 。 





售 <> 尽 上 


短 
AS 





业 承 以 前 文件 的 权限 和 所 有 者 等 设 
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当 程序 结束 时 ， 用 户 能 见 到 什么 ? 用 户 说 ,“ 啊 ， 我 看 到 了 发 生 的 改变 。Perl 修改 我 的 文件 fred03.dat， 做 了 我 希望 的 修改 ， 
并 将 早期 的 文件 保存 在 叫做 fred03.dat.bak 的 文件 之 中 ”但 我 们 知道 的 真相 是 : Perl 不 会 修改 任何 文件 。 它 新 建 了 一 份 修改 
后 的 拷贝 ， 说 “Abracadabra 〈 咒 语 )” 当 在 魔术 棒 出 现 过 闪光 后 ， 文 件 就 被 交换 了 。 很 狭 独 吧 ! 







































































某 些 人 喜欢 将 ~ (tlde) 作为 SAI 的 值 ， 这 同 emacs (Unix 上 的 一 个 编辑 器 ) 处 理 备份 文件 类 似 。$^I 另 一 个 可 能 值 是 空 串 ， 
这 会 修改 文件 ， 但 不 会 将 原来 的 文件 进行 备份 。 由 于 在 模式 中 少 输入 几 个 字符 就 能 将 以 前 的 数据 去 掉 ， 因 此 除非 有 特殊 的 
理由 ， 和 否则 不 要 使 用 空 串 。 毕 竟 当 这 一 切 完成 时 ， 再 删除 备份 文件 也 是 很 容易 的 。 如 果 什 么 地 方 出 了 问题 ， 可 以 将 备份 文 
件 命名 成 以 前 的 文件 ， 知 道 如 何 使 用 Perl， 你 将 非常 轻松 〈 参 看 第 十 三 童 多 个 文件 重 命名 的 例子 )。 

























































































9. 5. 4 在 命令 行 中 进行 修改 








前 一 节 的 例子 是 非常 容易 写 的。 但 Larry 觉得 它 还 不 是 特别 的 简单 。 











想象 你 需要 更 新 上 百 个 文件 ， 这 些 文件 中 Randal 拼写 错误 ， 多 写 了 一 个 1 Randall。 你 可 以 写 一 个 类 似 于 前 面 的 程序 。 或 
者 在 命令 行 中 使 用 下 面 的 一 行程 序 : 



































$perl -p -bak -w -e "SRandall/Randal/g' fred*.dat 








Perl 有 完整 的 命令 行 选项 ， 通 过 它们 只 需 在 命令 行 中 输入 几 个 字符 ， 就 能 构建 一 个 完整 的 程序 争 。 我 们 来 分 析 上 述 程序 做 
了 些 什么 。 

















人 查看 perlrun 了 解 完 整 的 选项 列表 。 

















开始 的 命令 perl 同文 件 顶端 的 提 /asrVbin/perl 一 样 : 它 是 指使 用 pezl 程序 来 处 理 后 面 的 部 分 。 





-了 要 求 Penl 为 你 写 一 个 程序 。 它 算 不 上 是 一 个 完整 的 程序 ， 看 起 来 有 些 像 下 面 的 争 : 














争 print 出 现在 continue 块 中 。 查 看 perlsyn 和 perlrun 的 帮助 手册 了 解 更 多 信息 。 























WwWhile(<>){ 
Print; 


} 








如 果 想 更 少 , 可 以 使 用 替代; 它 略 挥 print 语句 ， 你 可 以 只 输出 你 感 兴趣 的 部 分 。( awk 的 粉丝 (fans) 知 道 -了 和 
n。) 再 声明 一 次 ， We 完整 的 程序 ， 但 能 省 略 掉 大 量 的 输入 。 



































下 一 个 选项 是 -ipbak， 它 在 程序 开始 处 将 $^ 工 的 值 设 置 为 “.bak”。 如 果 不 需 要 备份 文件 ， 可 以 使 用 -i 参数 ， 后 不 接任 何 
的 扩展 名 。 如 果 不 需 要 多 余 的 降落 伞 , 则 可 只 在 飞机 上 留 下 一 个 。(f you dont want a spare parachute, you can leave the airplane 
with just one.)〈 这 里 仅 是 一 个 比喻 ， 译 者 注 ) 






































我 们 已 经 见 过 -w: 作用 是 将 警告 打开 。 
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< 人 选项 涵义 是 “执行 下 面 的 代码 。” 即 是 说 MRandalyRandal/sg 字符 串 被 当 作 Perl 代码 执行 。 由 于 我 们 有 while 循环 (-p 选 
项 )， 这 段 代 码 被 放 在 循环 内 ，print 之 前 。 由 于 技术 上 的 理由 ，-e 代码 中 最 后 一 个 分 号 是 可 省 略 的 。 如 果 有 多 个 -e 选项 ， 
因此 有 多 块 代 码 ， 只 有 最 后 一 个 分 号 是 可 省 略 的 。 















































最 后 一 个 参数 是 fred*.dat， 它 指定 @ARGY 应 当 包 含 匹 配 上 此 模式 的 文件 名 。 这 几 部 分 综合 起 来 ， 就 是 一 个 大 致 如 下 的 程 
序 ， 输 入 为 匹配 上 fred*.dat 的 文件 ; 





#! /usrbin/perl --W 


$ALI =“.bak”; 

WwWhile(<>){ 
SRandall/Randal/sg; 
Print; 


} 





将 这 个 程序 和 前 面 的 程序 进行 比较 ， 可 以 发 现 它们 是 非常 相似 。 这 些 命令 行 的 选项 是 非常 方便 的 ， 对 吧 ? 














9. 5. 5 非 捕捉 用 的 括号 





现在 ， 你 已 经 知道 括号 可 以 捕捉 匹配 上 的 字符 串 ， 并 将 它们 存 入 变量 之 中 ， 如 果 只 想 用 括号 将 某 部 分 进行 分 组 ? 考虑 这 样 
的 正则 表达 式 : 只 希望 其 中 一 部 分 括号 中 所 匹配 的 内 容 被 存 入 内 存 变 量 中 。 在 下 面 的 例子 中 ， 我 们 希望 “bronto” 是 可 选择 
的 ， 为 了 将 它 变 成 可 选择 的 ， 我 们 需要 将 它 用 括号 括 起 来 。 接 着 ， 模 式 使 用 了 一 个 模式 可 以 得 到 “Steak "或 者 “burger”， 匹 
配 上 的 字符 串 被 存 入 内 存 变 量 中 。 






































it(/(bronto)?saurus (Steaklburger)/) 
| 


Print“Fred wants a $2\n2”” 


} 


即便 "bronto" 没 有 被 匹配 上 ， 此 部 分 仍然 会 存 入 $l 。Peal 统计 开 括 号 的 个 数 ， 从 而 给 这 些 变量 命名 。 我 们 需要 的 部 分 被 存 入 
$2。 当 模式 变 复杂 时 ， 情 况 就 变 得 非常 复杂 。 











幸运 的 是 ，Perl 的 正则 表达 式 有 一 种 方法 可 以 使 括号 只 进行 分 组 ， 而 不 会 引起 内 存 变 量 的 分 配 。 我 们 将 它 叫做 非 捕 捉 用 的 
括号 Cnon-capturing parentheses )， 对 于 它 ， 有 一 个 特殊 的 写法 。 我 们 在 开 括号 后 面 加 上 一 个 问号 和 冒号 ，(?:) 争 ， 其 作用 事 
告诉 Perl 括号 只 是 分 组 的 作用 。 















































急 这 是 ?号 在 正则 表达 式 中 的 第 四 种 用 法 : 问号 ， 表 示 0 或 1 的 数量 词 ， 非 贪 焚 修 饰 符 ， 现 在 是 开头 符 


























改变 上 述 正则 表达 式 ， 使 之 对 “bronto" 古 非 捕捉 用 的 括号 ， 我 们 需要 的 部 分 被 存 入 变量 $1 。 





it(/(2:bronto)?saurus (Steaklburger)/) 


{ 
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Print“Fred wants a $lvn”; 
} 
如 果 以 后 需要 改变 正则 表达 式 ， 如 在 brontosaurs burger 上 再 加 入 barbecue， 我 们 可 以 加 入 ' 呈 BQ ”( 含 有 空格 )， 并 且 使 括号 
是 非 捕捉 用 的 ， 那 么 我 们 需要 的 部 分 所 对 应 的 内 存 变 量 仍 为 $1。 和 否则 ， 可 能 每 一 次 在 正则 表达 式 中 加 入 括号 时 ， 需 要 改变 
内 存 变量 名 。 






























































让 (2:bronto)?saurus (2:BBQ )?2(Steaklburger)/) 
{ 


Print“Fred wants a $ln2” 


} 





Pezl 的 正则 表达 式 的 括号 还 有 些 其 它 的 特殊 用 法 ， 它 们 可 以 完成 某 些 复杂 的 功能 ， 如 向 前 找 ， 向 后 找 ， 内 霸 注 释 ， 甚 至 在 
模式 中 执行 代码 。 你 可 以 参阅 perlre 的 帮助 手册 了 解 更 详细 的 信息 。 





9. 6 练习 


答案 请 参照 附 录 A: 
1. 辐 写 一 个 模式 , 它 能 匹配 $what 当前 的 内 容 的 3 份 连续 拷贝 。 也 就 是 说 ,如 果 $what 为 ffed, 则 此 模式 能 匹配 fredfredfred。 


如 果 $what 为 ffedlbarney， 则 此 模式 能 匹配 fredfredbarney, barneyfredfred, barneybarneybarney, 或 者 其 它 的 变种 。( 提 示 : 
你 应 当 在 程序 的 顶端 设置 $what 的 值 ， 如 my $what = 'fredlbarney” ) 





2. [12] 写 一 个 程序 ， 它 可 以 得 到 当前 文本 文件 的 一 个 拷贝 。 在 拷贝 的 文件 中 , 字符 串 Fred( 大 小 写 无 关 ) 将 被 Larry 替换 掉 。 
(因此 ，“Manfred Mann” 将 变 成 “ManLarry Mann”.) 输入 的 文件 名 已 经 在 命令 行 中 指定 《不 需要 询问 用 户 )， 输 出 的 
文件 名 是 对 应 的 输入 文件 名 后 面 加 上 .out。 























3. [8] 修 改 上 面 程序 ， 使 之 将 Fred 由 Wilma 替换 ，Wilma 由 Fred 替换 。 如 果 输 入 的 为 fed&wilma， 则 输出 为 Wilma$Fred。 

















4.， [10] 额外 练习 : 写 一 个 程序 在 你 所 有 的 练习 的 答案 前 加 上 下 面 这 样 一 行 : 














a) “ 横 Copyright (C) 20XX by Yours Truly 














将 上 面 一 行 放 在 “shebang”" 行 (Perl 程序 的 第 一 行 ，#Wusrbin/perl (可 能 随 Perl 安装 的 位 置 而 有 所 不 同 ， 但 是 指 第 一 行 ， 
译 者 注 )) 下 面 。 你 应 当 在 “ 源 文件 ”中 修改 ， 但 请 备份 文件 。 假 定 你 可 以 在 命令 行 中 同时 输入 程序 和 需要 的 修改 的 文 
件 和 名 。 











5. [15] 额 外 练习 : 修改 第 四 题 程 序 ， 如 果 程 序 已 经 有 copyright 这 一 行 ， 则 不 进行 修改 。 提 示 : 由 <> 读 入 的 文件 名 可 以 在 
$ARGYVY 中 找到 。 
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第 十 章 更 多 控制 结构 





在 本 章 中 ， 你 可 


苹 

















判 结构。 很 如 


以 见 到 其 它 书 写 Perl 代码 的 方法 。 对 于 大 多 数 而 言 
完成 任务 。 你 不 需要 在 你 
欣 1 J 能 ， 在 你 读 完 本 : 
































这 些 技术 不 能 使 Penl 更 强大 ， 但 它们 能 让 你 更 容易 的 
自己 的 代码 中 使 用 这 些 技术 ， 但 请 不 要 跳 过 本 章 。 你 肯定 会 或 早 或 迟 的 在 别人 的 代码 中 读 到 这 些 
必 时 ， 就 能 见 到 它们 。 





10. lunless 控制 结构 


在 让 控制 结构 中 ， 只 




















} 





有 条 件 为 真 时 ， 才 执行 块 中 的 代码 。 如 果 你 想 在 条 件 为 假 时 执行 ， 可 以 使 用 unless : 
unless($fred =~ /人 [A-Z_]Nwx*$/D{ 
print“The value of \$fred doesn't look like a Perl identifier name.m” 


unless 的 含义 是 : 除非 条 从 





为 真 ， 和 否则 执行 块 中 的 代码 。 这 和 在 让 语句 的 条 件 表 达 式 前 面 加 上 !( 取 反 ) 所 得 结果 是 一 相 
另 一 种 观点 是 ， 可 以 认为 它 自身 含有 else 语句。 如果 不 太 明 白 unless 语句 ， 你 可 以 把 它 用 让 语句 来 
际 的 重 写 ): 



































if($fred =~ 作 [A-Z_]JNwx$/{ 
# 什 么 也 不 做 
jelse{ 


的 。 
写 〈 头 脑 中 ， 或 者 实 





} 


print“The value of\$fred doesn'tlook like a Perl identifier namen”; 

















if(! ($fred =~ /A[A-Z_]\ws*$/D){ 





写 后 的 效率 不 会 变化 ， 它 们 会 被 编译 成 相同 的 内 部 字 节 和 码 。 另 一 种 重 写 方法 是 ， 在 条 件 表达 式 前 使 用 取 反 




















符号 (): 
Print“The value of \$fred doesn't look like a Perl identifier name.m”; 
} 
你 应 当选 择 最 容易 理解 的 方式 来 书写 代码 ， 因 为 很 可 能 你 得 维护 人 员 也 最 熟悉 这 种 写法 。 如 果 在 让 语句 前 加 上 取 反 符号 (0 
最 容易 理解 ， 那 就 用 这 种 方法 。 当 然 ， 你 也 可 能 认为 ， 用 unless 更 自然 
10. 1unless 和 else 语句 一 起 使 用 
unless 
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也 可 以 有 else 语句 。 虽 然 语 法 上 支持 ， 但 可 能 引起 混 清 : 


122 /201 


9/21/2006 


Perl 语言 入 门 (第 四 版 ) 





unless ($mon =~ /^AFeb/){ 
Print “This month has at least thirty days.\n ; 
jelse1{ 
print “Do you See what's going on hereyn ; 


} 








某 些 人 可 能 喜欢 这 种 用 法 ， 特 别 是 第 一 部 分 代码 很 短 〈 如 只 有 一 行 代码 ) 而 第 二 部 分 较 长 时 。 但 我 们 倾向 于 使 用 让 语句 ， 
将 条 件 部 分 取 反 ， 或 者 改变 两 部 分 的 位 置 : 








if($mon =~ /Feb/){ 

Print “Do you See what's going on hereyn ; 
}else{ 

print“This month has at least thirty days.m” ; 
j 





记 住 你 的 代码 要 给 两 个 的 “读者 ”看 : 执行 代码 的 计算 机 ， 以 及 确保 代码 执行 的 人 。 如 果 他 不 能 很 好 理解 你 的 代码 ， 那 很 
可 能 计算 机 也 不 能 正确 执行 。 














10，2until 控制 结构 


有 时 ， 和 希望 将 while 循环 的 条 件 部 分 取 反 。 此 时 ， 可 以 使 用 until 





until($j > $i){ 
和 *=2; 
} 





这 个 循环 一 直 执行 ， 直 到 条 件 表 达 式 的 返回 值 为 真 为 止 。 它 和 whbile 循环 非常 类 似 ， 只 是 在 条 件 为 假 时 重复 执行 ， 而 不 是 
在 条 件 为 真 的 情况 下 执行 。 条 件 表达 式 在 第 一 次 欠 代 前 即 会 被 求 值 ， 因 此 这 是 0 次 或 多 次 的 循环 ， 和 while 循环 一 样 争 。 
同 让 和 unless 一 样 ， 将 条 件 部 分 取 反 ， 即 可 将 until 循环 写成 同 while 循环 一 样 。 通 第 ,你 会 发 现 使 用 until 是 非常 简单 和 目 
然 的 。 


























合 Pascal 程序 员 应 当 小 心 : 在 Pascal 中 ， 
前 的 条 件 表达 式 的 值 为 真 。 








复 的 until 语句 至 少 要 执行 一 次 欠 代 ， 但 Perl 中 的 until 循环 可 能 一 次 也 不 执行 ， 如 果 循 环 执行 











10. 3 表达 式 修 饰 符 


为 了 得 到 更 紧凑 的 形式 ， 表 达 式 后 可 以 紧 接 控制 修饰 语 。 如 ， 站 修饰 语 可 以 像 让 块 那样 使 用 : 























Print“q$n is a negative number\n” 让 $n<0; 








上 述 代 码 和 下 面 代码 的 结果 相同 ， 除 了 少 书写 括号 和 人 花 括号 外 命 : 
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急 也 少 了 些 换行 符 。 但 我 们 应 当 指 出 花 括 号 类 型 创造 了 新 的 作用 域 。 在 极 少数 情况 下 ， 你 需要 了 解 其 完整 的 细节 ， 参 见 相应 的 文档 。 





if($n < 0){ 
print “$n is anegative numberm” 


} 








Perler 一 般 都 喜欢 少 输 入 些 字 符 。 简 写 的 形式 读 起 来 很 像 英文 ;输出 这 段 消息 ， 如 果 知 小 于 0。 








条 件 表 达 式 也 是 先 被 求 值 的 ， 虽 然 被 放 在 后 面 。 这 和 通常 的 的 从 左 到 右 的 顺序 相反 。 要 理解 Perl 代码 ， 应 当 像 Perl 内 部 的 
编译 器 那样 ， 将 整个 语句 读 完 ， 来 其 具体 的 含义 。 























还 有 一 些 其 它 的 修饰 语 : 





&error(Tnvalid input”) unless 儿 valid($input); 
$i*=2unitl $i> 和 $j; 

print“”, ($n += 2) while $n <10; 

多 greet($_) foreach @person; 





它们 和 你 预期 的 一 样 〈 我 们 希望 是 )。 每 一 个 都 可 以 按 前 面 的 让 修 饰 语 例子 类 似 的 方法 重 写 。 例 如 : 











while ($n < 10){ 
print“”, ($n +=2); 
} 














应 当 强 调 下 print 语句 中 佛 括号 的 表达 式 ， 它 将 2 加 给 $n， 再 将 结果 传 给 Sn 。 然 后 ， 这 个 值 被 输出 。 








这 些 简写 形式 读 起 来 很 像 自 然 语 言 : call the &greet subroutine for each @person in the list (对 于 列表 @person 中 的 每 一 元 素 ， 
调用 &greet 子 程序 )。Double $i until its larger than $j〈 将 $i 加 倍 ， 直 到 大 于 和 j 为 止 ) 争 。 这 些 修饰 语 通常 按 如 下 语句 那样 使 
用 : 



































急 它 帮助 我 们 那样 思考 。 





print“fred is “fred" ,barney is “$barney”\n” 让 $IL_ am_curious; 








将 这 些 代 码 “ 反 转 ”， 可 以 把 重要 部 分 放 在 前 面 。 上 述 代码 的 重点 是 观察 某 些 变量 ， 而 非 你 是 否 好 奇 (ou're curious.) 钙 。 
有 些 人 习惯 将 这 个 语句 写 在 一 行 里 面 ， 可 能 在 让 语句 前 都 加 入 几 个 制 表 符 (tap)， 将 它 移 到 右边 ， 如 我 们 例子 显示 的 那样 
另 一 些 人 喜欢 将 让 语句 放 在 新 行 中 : 






































急 我 们 自己 创建 的 名 字 $IL_ am_curious, 它 不 是 Perl 内 内 的 变量 。 通 常 使 用 这 种 技术 的 程序 员 习 惯 将 变量 叫做 $TRACING, 或 者 使 用 constant 
pragma 声明 的 名 














好 





print “fred is "fred ,barney is “$barney An” 
让 $IL_ am_curious; 
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虽然 可 以 将 这 些 含有 修饰 语 的 表达 式 重 写 ， 但 反 过 来 不 一 定 正确 。 只 有 单个 表达 式 才 允 许 按 这 两 种 方式 书写。 如 你 不 能 写 
SO111E 态 访 8 这 so11e 了 加 g Wjile so11e 态 12g 2 oze 太 iag 2101ess oaze 态 加 8 jyreacj sommetpinag， 这 会 变 得 极端 复杂 。 并 且 也 不 能 在 
修饰 语 左 端 使 用 多 条 语句 。 如 果 在 修饰 语 两 端 需要 使 用 多 行 语句 ， 那 按照 老 方法 来 号， 使 用 括号 和 人 花 括 号 。 























和 我 们 在 让 修饰 语 提 到 的 那样 ， 控 制 表达 式 (右边 ) 首 先 执 行 ， 这 和 老 方 法 是 一 样 的 。 








对 于 foreach 修饰 语 ， 不 能 选择 其 它 的 控制 变量 ， 它 总 是 $_。 一 般 情 况 下 ， 这 不 会 有 什么 问题 ， 但 是 ， 如 果 需 要 不 同 的 控 
制 变量 ， 你 可 以 按 传统 的 方法 书写 foreach 循环 。 








10，4The Naked Block 控制 结构 





被 称 为 “ 裸 的 ” 块 是 指 没有 关键 字 或 条 件 的 块 。 假 如 有 一 个 while 循环 ， 大 致 如 下 : 








while(condition){ 
body; 
body; 
body; 

} 





将 关键 字 while 和 条 件 表达 式 去 掉 ， 则 有 了 一 个 “ 裸 的 ” 块 : 


{ 
body; 
body; 
body; 
} 


“ 裸 的 ” 块 看 起 来 像 while 或 foreach 循环 ， 除 了 它 不 循环 外 ; 它 执行 “循环 体 ” 一 次 ， 然 后 结束 。 它 根本 就 没 循环 ! 
你 也 可 能 在 其 它 地 方 使 用 过 “ 裸 的 ” 块 ， 这 通常 是 为 临时 变量 提供 作用 域 ; 


{ 


Print “Please enter a number: ; 
chomp(my $n = <STDIN>); 





my $root = sqrt $n; # 计 算 平 方 根 
Print“The square root of $n is $root\n2”; 


} 


这 段 代 码 块 中 , $n 和 $root 这 两 个 临时 变量 只 在 此 块 中 有 效 。 作 为 一 条 通用 规则 , 所 有 变量 应 当 在 最 小 的 使 用 范围 内 被 声明 。 
如 果 某 个 变量 只 在 几 行 内 使 用 ， 你 可 以 将 这 几 行 放 在 一 个 “ 裸 的 ”代码 块 中 ， 并 在 其 中 声明 变量 。 如 果 在 后 面 还 需 使 用 $o 
和 $root， 则 需 在 一 个 更 大 的 范围 内 声明 它们 。 













































































你 可 能 已 经 注意 到 了 sqrt 函数 ， 并 猜测 它 是 什么 。 是 的 ， 我 们 以 前 没有 介绍 过 它 。Perl 有 许多 内 航 函 数 ， 要 完整 介绍 它们 ， 
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超出 了 本 书 的 范围 。 但 如 果 准 备 好 了 ， 可 以 阅读 perlfunc 的 帮助 手册 来 了 解 更 多 的 信息 。 


10. Selsif 语句 





很 可 能 需要 检测 一 连 串 的 条 件 表达 式 ， 一 个 接 一 个 ， 来 判断 哪 一 个 是 真 。 这 可 以 在 计 控 制 结构 中 使 用 elseif 语句 做 到 ， 如 
下 例 : 


it(!defined $dqino){ 

Print “The value is undef.\n ; 
jelsif($dino =~ /人 -?Ad+\.29/){ 

Print “The value is an integerNn ; 
jelsif($dino =~ /A-2AdAd+S/){ 

print “The value is a__Simple_floating-point numberAn ; 
jelsif($dino eq ){ 

Print “The value is the empty stringn ; 
jelse{ 

Print“The value si the string “$dino”\n”; 


} 





Perl 会 依次 检测 条 件 表达 式 。 当 某 个 成 功 时 ， 相 应 的 代码 即 被 执行 ， 整 个 控制 结构 也 就 结束 了 人 争 ， 然 后 转 到 后 面 〈 控 制 结 
构 之 后 ) 执行 。 如 果 没 有 不 成 功 ， 则 else 代码 块 被 执行 。(else 语句 是 可 选 的 。 当 然 ， 本 例 中 包含 它 是 非常 明智 的 ) 






































刍 Perl 没有 像 C 语言 “switch ”结构 中 的 “falhthrough (直接 跳 入 ) ”下 一 个 代码 块 的 功能 。 











elsif 语句 的 个 数 是 没有 限制 的 ， 但 是 ， 如 果 Perl 执行 第 100 个 elsif 语句 ， 则 需 执 行 前 99 个 条 件 判断 语句 。 如 果 需 要 半 打 
(6) 以 上 的 els 放 语句 时 ， 应 当 考 虑 是 和 否 存在 更 有 效率 的 实现 方法 。Perl FAQ (参见 perlfaq 的 帮助 手册 ) 中 有 许多 关于 如 何 模 
拟 其 它 语言 中 的 “case” 或 “ 汪 witch”" 语 名 的 方法 。 




















你 可 能 注意 到 关键 字 : elsif， 只 有 一 个 e。 如 果 写 成 “elseif`*，Perl 会 提示 拼写 错误 。 为 什么 ? 因为 Larry 认为 应 该 这 样 争 。 





革 


























急事 实 上 ， 他 拒绝 任何 建议 : 例如 ， 至 少 应 当 允 许 它 是 一 种 合理 的 选择 方式 “如 果 想 写 第 二 个 e,， 很 简单 。 第 一 步 : 你 自己 发 明 一 种 语言 。 
第 二 步 : 使 它 流 行 起 来 。” 当 创建 你 自己 的 语言 时 ， 你 可 以 随意 命名 这 些 关键 字 。 我 们 不 希望 你 的 语言 是 第 一 个 出 现 像 “elseunless” 这 样 的 
关键 字 的 语言 。 















































10. 6 自 增 和 自 减 


常常 需要 一 个 标量 变量 可 以 自动 增 1 ， 或 者 减 1 。 由 于 这 种 操作 很 平常 ， 因 此 同 其 它 操作 频繁 的 表达 式 一 样 ，Perl 也 提供 
了 一 种 简写 形式 。 








自 增 运算 符 (+H) 会 使 标量 变量 自动 加 1 ， 这 和 C 以 及 类 似 语言 是 一 样 的 : 


Imy $bedrock = 42; 
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$bedrock++; #$bedrock 的 值 加 1 ;现在 为 43 


和 其 它 方法 一 样 ， 如 果 变 量 上 加 1 ， 则 此 变量 会 根据 需要 自动 被 创建 


























my @people =qw{f fred barey fred Wilma dino barney fred pebbles}; 








Imy 和 counti 丰 折 的 空 的 hash 
$count{$_}++ foreach @people; # 根 据 情 况 创 建新 的 keys 和 values 








第 一 次 执行 foreach 循环 时 ，$count{$_} 自 增 1 。 此 时 ，$countf “fred”} 从 undef 〈 由 于 之 前 hash 中 不 存在 ) 变 成 1 。 第 二 次 
执行 foreach 循环 时 ，$count{ "barney?} 变 成 1 ; 接着 ，$count{ “fred} 变 成 2 。 每 执行 一 次 循环 ，%count 中 的 某 个 元 素 增 1 ， 
或 者 新 元 素 被 创建 。 循 环 结束 时 ，$count{ 'fred”} 值 为 3 。 这 提供 了 一 种 查看 某 个 元 素 是 否 存在 于 列表 之 中 ， 以 及 其 出 现 次 





数 的 方法 。 























类 似 的 ， 自 减 运 算 符 (-) 将 标量 变量 的 值 减 1 : 


$bedrockc--; #$bedrock 值 减 1 ， 现在 为 42 


10. 6. 1 自动 增 量 的 值 


获得 以 及 改变 此 变量 的 值 ， 可 在 一 步 内 究 成。 将 ++ 放 在 变量 前 ， 先 将 此 变量 增 1 ， 再 取 其 值 。 这 是 前 置 ++: 


my $m = $; 








my $n = ++$m; #$m 的 值 增加 到 6 ， 将 此 值 赋 给 $a 


或 者 将 - 放 在 变量 前 ， 再 取 其 值 。 这 是 前 





























my $c = --$mi; #m 的 值 减 到 5 ， 再 将 此 值 赋 给 $c 























下 面 还 有 一 些 类 似 的 方法 。 变 量 放 在 前 面 ， 先 得 到 此 变量 的 值 ， 再 进行 自 增 或 自 减 。 这 被 称 为 后 置 ++ 或 后 置 --: 





my $d = $m++; 考 d 得 到 先前 的 值 (5 )， 然 后 自 增 到 6 
my $e = $m--; 直 d 得 到 先前 的 值 (6 )， 再 自 减 到 5 


























上 述 运算 同时 做 了 两 件 事 。 取 其 值 ， 并 改变 其 值 。 如 果 运 算 符 (++ 盖 ) 在 前 ， 则 先 增加 《或 减少 )， 然 后 取 其 值 。 
































如 果 这 些 表 达 式 单独 出 现 争 ， 只 是 利用 其 改变 值 的 特点 ， 则 将 操作 符 (++,-) 放 在 前 面 或 者 后 面 是 没有 区 别 的 争 : 


争 也 就 是 void context 























争 了 解 语 言 是 如 何 实现 的 程序 员 ， 


置 的 类 型 进行 优化 , 。 
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可 能 猜测 后 置 ++ 和 后 置 -- 的 效率 要 低 一 些 ， 但 Perl 不 是 那样 的 。 当 在 void context 中 使 用 时 ，Perl 会 将 后 
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$bedrock++; 奏 bedrock 值 加 1 
++$bedrock' # 辣 上 ; $bedrock 值 加 1 





这 种 操作 通常 和 辨别 hash 中 是 否 存 在 某 个 元 素 的 应 用 结合 在 一 起 : 





my @people =qw{ fred barneybam-bamm Wilma dino barney betty pebbles } ; 


Iny %Seeni; 


foreach (@Ppeople){ 
Print “Tve seen you Somewhere before, $_I\n”; 


让 $seen{$_}++; 





barney 第 一 次 出 现时 ，$seen{$_}++ 的 值 为 false， 因 为 此 时 $seen{$_} 为 $seen{“barney”}， 其 值 是 undef， 同 时 $seen{“barney”} 
的 值 增 1 。 当 barney 再 次 出 现时 ，$seen{“barney”} 为 tue， 因 此 此 消息 被 输出 。 























10. 7for 控制 结构 


Pezl 的 for 控制 结构 和 其 它 语 言 中 的 for 控制 结构 类 似 。 如 下 : 








fordnitialization; test; increment)j{ 
body; 
body; 


对 于 Perl 来 讲 ， 这 个 循环 和 while 循环 类 似 ， 看 起 来 大 致 如 下 合 : 








急 增 量 在 一 个 continue 块 中 进行 的 ， 但 超出 了 本 书 的 讨论 范围 。 参 见 perlsyn 了 解 详细 的 信息 。 








站 








initialization; 

while(testb{ 
body; 
body; 


increment， 


for 循 环 的 最 常用 用 法 是 ， 进 行 重复 的 运算 ; 





for($i =1; $i <=10; $i++){ # 从 1 到 1 0 
print “Tcan count to $in2” 


如 果 以 前 见 过 这 种 程序 ， 那 不 用 阅读 注释 你 就 知道 第 一 行 的 含义 。 循 环 开始 前 ， 控 制 变 量 $i 值 设 置 为 1 。 接 着 就 像 进入 一 
blei@163.com 128 / 201 9/21/2006 





Perl 语言 入 门 (第 四 版 ) 























个 while 循环 ， 循 环 条 件 是 $i 小 于 等 于 10。 但 在 循环 之 间 ， 控 制 变 量 会 自动 增 1 。 




















第 一 次 进入 循环 时 , 扯 为 1 。 由 于 它 小 于 等 于 10， 则 进入 循环 。 虽 然 增 量 表达 式 在 循环 的 顶端 出 现 ， 但 它 在 循环 底 端 ， 输 
出 消息 后 执行 。 现 在 ，$i 变 成 了 2 ， 它 也 小 于 等 于 10; 我 们 又 一 次 进入 循环 ， 接 着 $i 增 到 3， 它 仍 小 于 等 于 有 10， 然 后 
复 。 



































接着 ， 我 们 再 进入 循环 ， 然 后 $i 的 值 继续 增 1 〈 此 时 为 9 )。 现 在 扑 变 成 10， 它 小 于 等 于 10。 我 们 最 后 一 次 执行 循环 内 的 
语句 ， 此 时 $i 的 值 为 10。 最 终 ，$i 增 到 11， 它 大 于 10。 则 循环 结束 ， 程 序 进 入 剩 下 的 部 分 。 



































这 三 部 分 同时 出 现在 顶端 ， 对 有 经 验 的 程序 员 来 讲 ， 当 读 到 第 一 行程 序 时 :“ 啊 ， 这 是 一 个 循环 ，$i 的 值 从 1 到 10。” 




















循环 结束 时 ， 控 制 变量 的 值 要 “大 ”1。 在 本 例 中 ， 控 制 变 量 的 值 为 11 争 。 这 个 例子 是 通用 的 。 例 如 ， 可 以 从 10 到 1: 























for($i = 10; $i >=1; $i--){ 
Print 'Ican count down to $ivn” 


} 


下 例 从 -150 到 1000， 步 长 为 3 人 : 





它 不 是 精确 得 到 1000。 最 后 一 个 数字 是 999， 因 为 $i 的 值 必须 是 3 的 倍数 。 











for($i = -1S0; $i <= 1000; $i +=3){ 
Print “$ivn 2” 
) 














这 三 个 部 分 〈 初 始 化 ， 条 件 判 断 ， 步 长 ) 的 任意 部 分 均 能 为 空 ， 但 分 号 不 能 省 略 。 在 下 面 这 个 不 常见 的 例子 中 ， 条 件 判 断 
部 分 为 一 个 蔡 换 表达 式 ， 步 长 部 分 为 空 : 


























for($_=“bedroclke: sS/CJ/A; ){ # 如 果 SMW 成 功 则 进入 循环 


Print “One character js: $1m” 


} 











条 件 判 断 部 分 是 一 个 替换 表达 式 ， 它 在 奉 换 成 功 时 返回 tue 。 在 本 例 中 ， 第 一 次 进入 循环 ， 会 将 bekrock 的 第 一 个 b 去 掉 。 
每 一 次 欠 代 均 会 移 除 一 个 字符 ， 当 字符 串 为 空 时， 替换 失败 ， 循 环 结束 。 




















如 果 条 件 判断 表达 式 〈《 分 号 中 间 那 个 ) 为 军 ， 则 恒 真 ， 此 时 为 无 限 循环 。 除 非 你 知道 怎样 从 这 类 无 限 循环 中 退出 ， 和 否则 不 
要 写 出 这 样 的 代码 ， 推 出 的 方法 在 本 章 后 面 讨论 : 


























forG3) 
Print "Tt's an infinite looplNn ; 


} 





下 面 是 更 像 Perl 无 限 循环 的 例子 :while 循环 ， 如 果 你 需要 的 话 争 : 
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， 这 依赖 于 你 的 系统 IJO， 以 及 








环 
证 





急 如 果 不 小 心 进 入 无 限 循环 ， 试 试 Ctrl+C 能 和 否 退 出 。 当 按 下 Ctrl+C 后 ， 很 可 能 在 终端 中 还 有 许多 输出 


一 些 凑 区 的 大 | 余 。 
































while(1){ 
Print “Its another infinite loopWNn”; 


} 











C 程序 员 熟 悉 第 一 种 方法 ， 但 其 至 初级 的 Perl 程序 员 也 知道 1 恒 真 ， 因 此 如 果 需 要 无 限 循环 ， 通 常 第 二 种 方法 比 第 一 种 更 
好 。Perl 能 识别 出 上 面 那 样 的 常数 表达 式 ， 并 对 其 优化 ， 因 此 不 会 有 效率 上 的 问题 。 
































10. 7. 1foreach 和 for 的 关系 








对 于 Perl 解析 器 (parsenD 而 言 ,， 关键 字 foreach 和 for 是 等 价 的 。 也 就 是 说 , 当 Perl 遇见 其 中 之 一 时 ， 和 遇见 另 一 个 是 一 样 的 。 
Perl 通过 括号 能 理解 你 的 目的 。 如 果 其 中 有 两 个 分 号 ， 则 是 for 循环 〈 和 我 们 刚 讲 的 类 似 ); 如 果 没 有 ， 则 为 foreach 循环 : 


























ford..10){ # 实 际 上 是 foreach 循环 ,从 1 到 10 
print “ITcan count to $_INn” 


} 














这 实际 是 一 个 foreach 循环 ， 但 写作 for。 除 了 本 例外 ， 本 书后 面 均 写作 foreach 。 在 实际 代码 中 ， 你 觉得 Perler 会 输入 这 四 
个 多 余 的 字符 吗 争 ? 除了 新 手 外 ， 一 般 均 写作 for， 你 也 应 当 像 Perl 那样 ， 通 过 查看 括号 内 分 号 个 数 来 判断 。 




















急 如 果 你 认为 是 , 那 你 没有 理解 我 们 的 观点 。 在 程序 员 中 ,特别 是 Perl 程序 员 ， 懒 惰 是 一 种 美德 。 如 果 不 信 ， 你 可 以 在 下 一 届 了 Perl Mongers 
集会 上 询问 他 们 。 



































在 Perl 中 ，foreach 循环 通常 是 一 个 更 优 的 选择 。 在 前 面 foreach 循环 〈 被 写成 了 for) 的 例子 中 ， 很 容易 看 到 其 范围 是 由 1 
到 10。 但 你 能 看 出 下 例 中 有 什么 问题 吗 ? 在 找到 答案 前 不 要 看 脚注 中 的 答案 争 : 

































































@ 这 里 有 2.5 个 错误 。 条 件 判 断 部 分 使 用 小 于 (<) 号 ， 因 此 实际 的 循环 具 执 行 9 次 而 非 10 次 。 第 二 ， 控 制 变量 是 $i， 但 循环 体 中 使 用 的 却 是 
$_。 还 有 半 个 错误 是 ， 对 于 这 种 写法 ， 读 ， 写 ， 维 护 ， 调 试 的 代码 更 多 ， 这 也 是 我 们 说 foreach 形式 是 一 个 更 好 选择 的 原 











济 




















for($i = 1; $i < 10; $i++){ #Oops! 某 些 地 方 有 错误 。 
print “ITcan count to $_INn” 


} 


10. 8 循环 控制 


Perl 是 一 种 “structrued( 结 构 ) 程 序 语言 。 每 一 个 代码 块 均 有 一 个 入 口 ， 即 是 块 的 顶端 。 但 有 时 需要 对 它 进行 更 多 的 控制 。 例 
如 ， 你 可 能 希望 写 一 个 至 少 执行 一 次 的 while 循环 。 或 者 希望 能 更 早 的 从 代码 中 退出 。Perl 提供 了 三 种 循环 控制 的 操作 ， 可 
在 循环 块 中 起 到 某 些 作用 。 




















王 、 
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last 会 立刻 结束 循环 。( 这 同 C 语言 或 其 它 语言 中 的 "break” 语 句 类 似 )。 它 从 循环 块 中 





结束 ， 如 下 例 : 





# 输 出 所 有 出 现 fred 的 行 ， 直 到 遇见 
while(<STDIN>){ 
if( _ END__/){ 











# 这 个 标记 之 后 不 会 有 其 它 输入 了 


]ast; 
}elsif(fred/){ 
Print; 
} 


} 
帮 last 跳 转 到 这 里 栗 





当 输入 行 有 __END__ 标 记 时 ， 循 环 即 结束 。 最 后 的 注释 行 是 不 需要 的 ， 我 们 这 里 写 出 来 只 


__END_ 标记 





“紧急 退出 ” 当 执行 到 last， 循 环 即 








是 为 了 把 问题 说 汪 








世 贞 
灌 
吕 





Pedl 的 5 种 循环 体 分 别 是 for foreach, while, until， 以 及 “ 裸 ” 块 争 。 花 括号 括 起 来 的 让 块 ， 子 程序 争 不 算 。 在 上 面 的 例子 





中 ，1last 对 整个 循环 块 其 作用 。 





急 是 的 ， 可 以 使 用 last 从 “ 裸 的 ”代码 块 中 昌 


了 











争 这 可 能 是 一 个 坏 主意 ， 但 可 以 在 子 程序 里 








四 使 用 循环 控 











子 程序 内 执行 last 操作 ， 同 时 子 程序 没有 和 
环 控制 能 力 会 被 去 掉 ， 没 有 人 会 怀念 它 的 。 




















盾 环 块 ， 那 么 程序 的 流程 会 跳 到 主 程序 循环 块 的 后 押 








出 操作 符 控 人 


t 出 。 这 和 从 外 面 跳 入 “ 裸 的 ” 块 中 是 不 同 的 。 









































关子 程序 外 面 的 循环 。 也 就 是 说 ， 如 果 在 循环 块 内 调 
1。 在 将 来 的 Perl 中 ， 


口 








last 常用 在 最 内 层 的 循环 体 中 ， 可 以 从 中 跳 到 外 面 来 ， 这 在 下 面 会 介绍 。 





10.， 8.， 2 next 操作 
























































这 种 


用 一 个 子 程序 ， 
在 子 程序 内 的 循 





有 时 还 不 希望 结束 循环 ， 但 本 次 循环 已 经 结束 。 这 种 情况 下 ，next 是 非常 适用 的 。 它 跳 到 当前 循环 块 的 最 后 面 〈( 块 内 ) 全 。 














next 之 后 ， 又 会 进入 下 一 轮 循 环 〈 这 和 C 或 者 类 似 语言 的 “continue” 相 似 );: 























争 我 们 这 里 又 撒 了 一 个 小 谎 。 事 实 上 ，next 跳 到 循环 的 conttinue〈 通 常 省 略 ) 块 的 开头 处 。 参 见 perlsyn 了 解 详 细 的 信息 。 














# 分 析 输 入 文件 的 单词 
while(<>){ 
foreach(splitb{ 





$total++; 


next ifAWV/; 
blei@163.com 














# 将 $_ 分 拆 成 单词 ， 并 依次 赋 给 $_ 


# 不 是 “words” 的 被 跳 过 
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$valid++; 
$count{$_}++; # 对 每 个 单词 进行 计数 
机 finext 路 到 这 里 栗 


} 
| 
Print “total things = $total valid words = $valid\n”; 
foreach $word (sort keys 9%ocountb{ 


print '$word was seen $count{$wordj timem”; 


} 


这 几乎 是 到 目前 为 止 押 出 现 过 的 最 复杂 例子 ， 让 我 们 一 步 一 步 地 分 析 它 。wbile 循环 从 尖 括 号 输入 符 (<>) 中 读 入 ， 一 行 接 一 
行 的 ， 每 次 都 读 入 $_ 中; 你 以 前 已 经 见 过 了 。 循 环 每 次 执行 时 ， 这 一 行 均 被 读 入 $_ 中 。 











在 循环 体 中 ，foreach 循环 在 split 的 返回 值 上 进行 运 代 操作 。 你 还 记得 没有 参数 的 split 的 默认 参数 是 什么 吗 争 ? 是 $_， 分 
陋 符 时 空白 (whitespace)， 它 将 $_ 分 拆 成 一 串 单词 。 由 于 foreach 循环 没有 提 到 其 它 的 控制 变量 ， 那 么 它 为 默认 的 $_。 因 此 ， 
这 些 单词 依次 赋 给 $_。 









































急 如 果 不 记 得 了 ， 也 不 用 担心 。 不 要 花费 精力 在 能 在 perldoc 能 查 到 的 东西 上 。 












































旦 ， 我 们 刚才 不 是 说 过 ，$ 存储 的 是 一 行 值 吗 ? 是 的 ， 在 外 部 循环 中 ， 这 和 是 正确 的 。 但 在 foreach 循环 内 部 ， 它 存放 的 是 单 
词 。Perl 能 处 理 $_ 的 不 同 用 法 ， 这 种 事 经 常 发 生 。 


一 、 























现在 ， 在 foreach 循环 内 部 ，$_ 一 次 含有 一 个 单词 。$total 值 依次 增加 ， 它 统计 单词 的 总 数 。 接 着 一 行 〈 本 例 重 点 ) 检查 是 
否 有 nonword 字符 : 存在 字符 ， 数 字 ， 下 划 线 之 外 的 符号 。 因 此 如 果 它 是 Tom's; 或 者 含有 去 号 ， 引 号 ， 其 它 的 特殊 字符 ， 
则 会 匹配 上 此 模式 ， 从 而 跳 过 循环 的 后 部 分 ， 处 理 下 一 个 单词 。 





















































但 如 果 是 一 个 普通 的 单词 ， 如 fred，$valid 值 增 1， 同 时 $count{$_} 也 会 增 1， 每 一 个 单词 均 会 被 计数 。 当 这 两 重 循环 结束 
时 ， 我 们 就 把 用 户 感 兴趣 的 文件 中 的 所 有 单词 进行 了 统计 。 



































我 们 不 打算 解释 后 面 几 行 。 我 们 希望 你 现在 已 经 能 解决 它们 了 。 





























last, next 可 以 在 这 5 种 循环 中 使 用 : for foreach, while, until， 或 者 “ 宰 ” 块 。 如 果 块 是 藤 套 的 ，next 在 最 里 层 工 作 。 在 本 节 
结束 处 你 能 了 解 到 怎样 改变 它 。 














10. 8. 3 redo 操作 














循环 控制 的 第 三 个 操作 是 redo。 它 会 调 到 当前 循环 块 的 顶端 ， 不 进行 条 件 表达 式 判 断 以 及 接着 本 次 循环 。(〈 在 C 或 类 似 语 
言 中 没有 这 种 操作 。) 下 面 是 一 个 例子 : 





1 

















# 输 入 测试 
my @words = qw{ fred barney pebbles dino Wilma betty } ; 


Imy $errors = 0; 
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foreach(@words){ 











大 fredo 跳 到 这 上 


曰 霸 





和 


Print “Type the word :3; 


chomp(my $try = <STDIN>); 


if($try ne$_){ 
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Print “Sorry -IThat's not right nn ; 


$errors++; 
Tedo， 


} 





# 跳 转 到 循环 顶端 


Print“You've completed the tesb with $errors errorsm”; 


和 其 它 两 种 操作 一 样 ，redo 可 以 在 5 种 循环 体内 工作 ， 当 在 嵌 套 循环 体 中 时 ， 它 在 最 内 层 使 用 。 





next 和 redo 的 最 大 区 别 在 于 ，next 会 进入 下 一 次 循环 ， 而 redo 会 继续 执行 本 次 循环 。 下 面 这 个 例子 能 让 你 感受 到 这 个 3 





种 操作 的 不 同 争 : 


foreach(1..10){ 


print“Tteration number $_.nvn2 


Print “Please choose: last next, redo, or none of the above7; 
chomp(my $choice = <STDIN>); 


Print An ; 


last 让 $choice =~ /lasUii; 


next 让 $choice =~ /nexti; 


Tedo 让 $choice =~ Medo/ii 


Print “TIhat was't any of the choices...onwardli\nNn ; 


} 


Print “That's all, folks\n ; 


如 果 仅 输入 回 车 〈 尝 试 2 或 3 次 )， 循 环 会 顺 次 执行 。 如 果 在 4 时 选择 last， 循 环 立即 结束 ， 而 不 会 进入 “$"。 如 果 在 4 时 选 























择 next， 则 进入 $， 但 不 会 打印 出 “onward” 的 信息 。 如 果 在 4 时 选择 redo， 则 会 重复 一 次 。 





10. 8. 4 标签 块 





如 果 要 从 最 内 层 的 循环 














一 、 


或 让 是 非常 不 好 的 。 














由 于 这 些 原 因 














P 跳 出来， 可 以 使 用 标签 (abeD)。 标 签 在 Perl 中 就 像 一 般 标 识 符 一 样 : 由 字母 ， 数 字 ， 下 划 线 组 成 ， 
日 不 能 由 数字 开头 。 由 于 没有 前 绥 字 符 ， 标 签 可 能 和 内 据 的 函数 名 ， 或 者 你 自己 的 子 程序 名 混淆 。 如 果 将 标签 取 名 为 print 
，Larry 推荐 标签 均 大 写 。 这 会 防止 标签 和 其 它 标识 符 冲 突 ， 同 时 也 使 之 在 代码 中 更 突 























出 。 同 时 ， 标 签 很 少 使 用 ， 通 常 上 只 在 很 少 一 部 分 程序 中 出 现 。 


要 给 循环 体 加 上 标签 ， 


LINE: while(<>){ 





可 在 循环 前 


Oreach (SPlit){ 
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押 加 上 标签 和 








冒号 。 在 循环 体内 ， 可 以 根据 需要 在 last next, 或 者 redo 后 加 上 标签 名 ， 如 ; 
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lastLINE 让 /END__/;， # 推 出 Line 循环 














} 
} 


为 了 增加 可 读 性 ， 通 常 将 标签 放 在 左 侧 ， 不 管 当前 的 代码 是 否 缩 进 了 很 多 。 标 签 在 整 块 之 前 使 用 ， 不 是 针对 代码 中 的 某 些 
点 争 。 在 前 面 的 代码 块 中 ，__END__ 表 示 输 入 结束 。 当 这 个 标记 出 现时 ， 程 序 会 忽略 掉 剩 下 的 行 〈 甚 至 剩 下 的 文件 )。 


























急 因 为 这 不 是 goto。 








通 营 给 标签 取 一 个 名 词性 的 名 字 更 有 意义 争 。 如 上 例 中 ,由 于 外 层 循 环 一 次 处 理 一 行 ， 因 此 我 们 将 它 叫 做 LINE。 如 果 需 对 
内 层 循环 命名 ， 可 叫做 叫做 WORD， 因 为 一 次 处 理 一 个 单词 。 这 对 于 说 “ 移 到 下 一 个 单词 (move on to the) next WORD)" 或 
者 “重复 当前 行 Cedo(the currenb Line)"” 是 非常 方便 的 。 








急 当 然 ， 这 样 做 总 比 不 这 样 做 更 有 意义 。Perl 并 不 关心 你 将 标签 命名 为 XYZZY 或 者 PLUGH。 





10. 9 逻辑 操作 符 


Pezl 含有 所 有 必须 的 逻辑 操作 符 来 处 理 Boolean(true/false) 值 。 例 如 ， 进 行 逻辑 判断 的 逻辑 与 AND(&e& 和 逻辑 或 OR (|): 











if($dessert{ cake "} 攻 & $dqessert{f ice creanm }){ 
# 了 两 个 同 为 真 
print “Hooray! Cake and ice creamlNn ; 
jelsif($dessert{ cake” } 中 $dessert{ ice cream”}){ 
# 至 少 一 个 为 真 
Print “IThat's still good...\n ; 
jelse{ 
# 股 有 一 个 为 真一 什么 也 不 做 〈 我 们 很 难过 ) (dessert 甜点 ，cake 蛋糕 ，ice cream 冰 激 凑 ， 作 者 的 幽默 ， 译 者 注 ))) 
} 















































上 面 代码 中 的 逻辑 部 分 可 能 不 会 完全 判断 。 如 果 罗 辑 与 〈&& ) 操作 的 左 侧 为 false， 则 整个 为 false， 因 为 逻辑 与 在 两 个 均 
为 true 时 其 结果 才 为 tue。 在 这 种 情况 下 没有 理由 检测 右 侧 ， 因 此 右 侧 不 会 被 求 值 。 考 虑 下 述 例子 在 $hour 为 3 时 会 发 生 什 
么 : 
































让 (9 <= $hour) 多 & ($hour < 17)){ 
print “Aren't you Supposed to be at work.. .2m 7 


} 


同样 的 ， 如 果 光 辑 或 〈I 左 侧 结 果 为 fue， 则 右 侧 部 分 也 不 会 被 求 值 。 考 虑 下 述 例子 在 $name 为 fred 的 情况 : 





这 ($name eq 'fred ) 1($name eq "barney7)){ 
Print “You're my kind of guyWn”; 
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民 


于 这 种 行为 ， 这 些 操作 通常 被 称 作 “ 短 路 〈shortcircuit)” 逻 和 辑 操作 。 它 们 会 在 可 能 的 情况 下 立即 返回 结果 。 事 实 上 ， 我 
门 经 常 利 用 这 种 性 质 。 假 设 你 要 计算 平均 值 : 











一 





if(($n !=0) && ($total$n < S)){ 
Print “IThe average is below fiveNn ; 


} 


在 这 个 例子 中 ， 右 侧 具 在 左边 的 值 为 true 时 才 会 执行 ， 因 此 可 以 阻止 像 除数 为 0 而 引起 程序 月 省 这 样 的 错误 发 生 。 














10. 9. 1 短路 操作 的 值 


























和 C《〈 以 及 类 似 的 语言 ) 不 同 的 地 方 是 ， 短 路 操作 的 结果 是 最 后 被 执行 语句 的 返回 值 ， 而 非 仅仅 是 一 个 Boolean 值 。 结 果 
是 相同 的 。 如 果 最 后 被 执行 的 部 分 为 真 ， 则 整个 为 真 ， 为 假 ， 则 整个 为 假 。 

















一 、 


且 这 是 一 种 更 有 用 的 返回 值 。 这 些 理 由 之 一 就 是 ， 邮 和 辑 或 《OR) 可 以 方便 的 选择 一 个 默认 值 : 
































my $last_name = $last_name{f$someone] | 省 '(No lastname); 

















如 果 $someone 不 在 hash 中 ， 则 左 侧 值 为 undef， 为 false。 从 而 ， 庙 侧 代码 将 被 执行 ， 并 将 其 作为 默认 值 争 。 在 后 面 还 有 利 
j 这 种 特性 的 应 用 。 




























































































部 
过 


旬 这 种 用 法 中 ， 默 认 值 (No last name ) 不 仅 会 奉 换 undef 值 ， 也 会 蔡 换 所 有 的 false 值 。 这 对 于 大 多 数 名 字 都 没什么 影响 ， 但 0 和 空 
用 但 为 false 的 值 。 这 种 用 法 应 当 在 希望 替换 所 有 false 值 的 情况 下 使 用 。 






































10. 9. 2 三 元 操作 符 ?3: 











当 Larry 决定 Perl 应 当 具 有 哪些 操作 符 时 ， 他 不 希望 以 前 的 C 程序 员 在 Perl 中 找 不 到 C 中 出 现 过 的 操作 符 ， 因 此 他 在 Perl 
中 实现 了 所 有 C 的 操作 符 争 。 这 意味 着 C 中 最 容易 混淆 的 操作 符 : 三 元 操作 符 〈?:) 也 被 移植 过 来 了 。 虽 然 它 带 来 了 麻烦 ， 
但 有 时 也 是 非常 有 用 的 。 
























































急 坦 白 讲 ， 他 将 那些 在 Perl 中 没有 用 的 去 掉 了 ， 如 那些 能 将 数字 转换 成 变量 内 存 地址 的 操作 符 。 同 时 也 添加 了 一 些 操作 符 《〈 如 字符 串 连 
接 操 作 符 )， 这 让 C 程序 员 非 常 眼红 。 


























三 元 操作 有 些 像 if-then-else 一 样 ， 不 过 是 在 一 个 表达 式 之 中 。 被 称 作 “三 元 ”操作 符 是 因为 它 有 三 个 操作 数 ， 看 起 来 如 下 : 


Express 7 让 true_expr : 让 false_expr 




















首先 ， 表 达 式 被 求 值 。 如 果 为 true， 则 第 二 个 表达 式 被 执行 ; 否则， 第 三 个 表达 式 被 执行 。 右 侧 两 个 表达 式 中 有 且 仅 有 一 
个 被 执行 ， 另 一 个 则 被 包 略 。 也 就 是 说 ， 如 果 第 一 个 表达 式 为 tue， 则 第 二 个 表达 式 被 执行 ， 第 三 个 被 忽略 。 如 果 第 一 个 
表达 式 为 false， 则 第 二 个 被 忽略 ， 第 三 个 被 执行 ， 并 作为 表达 式 的 值 。 
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my $location = &is_weekend($dqay) ?2 “home”:“work”; 


下 例 中 ， 如 果 没 有 平均 值 ， 则 输出 一 些 连接 线 〈 一 ): 











Imy $average = $n ? ($total/$n) :“------ 
Print “Average: $averageNm”; 




















你 可 以 将 这 些 ?: 操作 用 站 结构 来 书写 ， 但 没有 那么 方便 : 


Imy $average; 
if$n){ 

$average = $total /$n; 
}else{ 

$averge =“------ 人 


Print“Average: $averageNm”; 














有 一 个 书写 存在 多 个 分 支 的 编程 技巧 ; 














my $size = 
($width < 10 ) ?2 “small”: 
($width < 20) 2“mediunm” : 
($width < 50) 2?“large”: 


“extra_large”; 扩 lefault 


上 述 代码 中 有 三 个 骨 套 的 ?:， 当 熟练 掌握 时 ， 这 能 给 你 的 工作 带 来 便利 。 











在 下 例 中 ，&is_weekend 决定 将 哪 一 个 表达 式 的 值 赋 给 $location: 








你 并 非 必 需 使 用 它 不 可 。 新 手 经 常 避免 使 用 。 但 你 提 























自己 的 程序 中 使 用 它 理 由 。 





10. 9. 3 控制 结构 : 使 用 部 分 求 值 的 操作 符 



































其 他 人 的 代码 中 见 到 展 











踪影 ， 我 们 希望 某 一 天 你 能 找到 一 个 在 你 


前 面 三 个 操作 符 &&, 1 ，?:， 均 有 一 个 共同 的 特殊 性 质 : 根据 左 侧 的 值 true 或 false)， 来 判断 是 否 执行 右 侧 代码 。 有 时 会 





被 执行 ， 有 时 不 会 。 由 于 这 个 理由 ， 这 些 操作 符 有 时 叫做 部 分 求 值 (partialevaluation ) 操作 符 ， 因 为 有 时 并 非 所 有 的 表达 








式 均 被 执行 。 部 分 求 值 操作 符 是 自动 的 控制 结构 急 。 并 非 Larry 想 
部 分 求 值 操作 符 引 进 Pen 后 ， 它 们 自动 成 了 控制 结构 。 

















多 茶 些 人 会 猜想 为 什么 在 这 一 章 介 绍 罗 辑 操作 ， 你 会 不 会 呢 ? 
































王 何 可 以 激活 或 解 








引入 更 多 的 控制 结构 到 Perl 中 来 。 而 是 当 他 决定 将 这 些 
除 某 甘 代码 的 执行 即 被 称 作 控 制 结 构 。 











幸运 的 是 ， 只 有 利用 这 些 表 达 式 的 副作用 ， 如 改变 变量 值 ， 或 引起 某 些 输出 ， 才 会 见 到 它们 。 例 如 ， 下 面 的 代码 ; 


($m < $n) ww ($m = $n); 
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注意 : 逻辑 与 (&&) 的 结果 没有 赋 给 任何 变量 争 ， 为 什么 呢 ? 




















镶 当 然 有 可 能 为 返回 值 ， 如 是 子 程序 的 最 后 一 个 表达 式 。 








如 果 $m 小 于 $n， 则 左 侧 为 tue， 右 侧 赋值 表达 式 即 被 执行 。 如 果 $m 的 值 不 小 于 $n， 左 侧 为 false， 则 右 侧 被 跳 过 。 上 述 代 
码 和 下 面 的 结果 一 样 ， 只 是 这 里 的 更 容易 理解 : 








it($m < $n) {$m= 4$n } 
也 许 你 在 维护 程序 ， 可 能 遇 到 下 面 这 样 的 代码 ; 
($m > 10) Print“why it it not greater?Nn”; 


如 果 $m 大 于 10， 则 左 侧 为 tue， 逻 辑 或 (OR) 运 算 执行 完毕 。 如 果 不 是 ， 则 左 侧 为 false， 碳 侧 信息 即 被 输出 。 这 可 以 “或 
者 说 应 当 ) 按 传 统 的 方法 来 书写 ， 如 用 证 或 unless 等 。 



































如 果 你 很 敏锐 ， 那 你 可 以 像 像 读 英 文 那 样 读 这 些 代 码 。 例 如 ， 检 查 $m 是 否 小 于 $n， 如 果 是 ， 则 进行 赋值 。 检 查 $m 是 否 大 
于 10， 如 果 不 是 ， 则 打印 出 消息 。 














通常 ，C 语言 背景 的 程序 员 ， 或 以 前 的 Perl 程序 员 习 惯 于 这 样 书写 控制 结构 。 它 们 为 什么 要 这 么 做 昵 ? 一 些 人 错误 地 认为 
这 样 做 的 效率 更 高 。 另 一 些 人 认为 这 些 技巧 让 他 们 的 代码 很 酷 。 还 有 一 些 人 仅仅 看 见 其 他 人 这 么 做 ， 他 们 就 这 样 做 而 已 。 

















同样 的 ， 三 元 操作 符 也 可 以 用 来 做 控制 结构 。 下 例 中 ， 我 们 想 将 $x 赋 给 两 个 变量 中 较 小 的 一 个 : 


($m < $n) ? ($m = $x) : ($n = $x); 


如 果 $m 更 小 ， 则 得 到 $x。 人 否则 ，$n 得 到 $x 。 























还 有 一 种 书写 逻辑 与 (AND ) 与 逻辑 或 〈OR ) 的 方法 。 可 以 使 用 单词 : and 与 or 争 。 这 些 单词 操作 符 和 符号 操作 符 的 含义 
相同 ， 但 它们 (单词 操作 符 ) 在 优先 级 的 底 端 。 由 于 它们 《单词 操作 符 ) 比 表达 式 自 身 的 结合 性 更 低 〈 按 照 优 先 级 来 讲 : 译 
者 注 )， 因 此 不 需要 括号 : 





















































急 还 有 低 优先 级 的 not( 同 逻辑 非 : 0) 以 及 很 少 使 用 的 xor。 























$m < $n and $m = $n; # 但 用 对 应 的 让 语句 来 书写 更 好 



































一 





旦 最 好 使 用 括号 。 优 先 级 是 容易 出 问题 的 。 除 非 能 明确 它们 之 间 的 优先 级 关系 ， 否 则 最 好 还 是 使 用 括号 。 单 词 操作 符 的 优 
先 级 非常 低 ， 通 常 可 以 容易 的 将 这 些 表达 式 分 成 两 部 分 来 理解 ， 先 分 析 左 侧 的 ， 再 〈 如 果 需 要 ) 分 析 右 侧 的 。 




































































昌 然 使 用 逻辑 运算 符 作为 控制 结构 可 能 引起 混淆 ， 但 有 时 也 接受 这 种 写法 。 在 Penl 中 打开 一 个 文件 的 惯用 手法 是 : 





open CHAPTER, $filename 
Or die“Can't open '$filename”:$!”; 
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通过 使 用 低 优 先 级 的 短路 操作 符 or， 我 们 要 求 Perl “open this file...or die!”。 如 果 打 开 成 功 ， 则 返回 true 值 ，or 运算 结 
如 果 失 败 ， 则 继续 执行 右 侧 代码 ， 返 回 失 败 的 消息 。 









































因此 ， 使 用 这 些 操作 符 作为 控制 结构 是 Perl 的 惯用 手法 中 的 一 种 。 恰 当 的 使 用 它们 ， 能 增进 你 的 代码 的 威力 ， 否 则 将 使 代 
码 难于 维护 。 但 请 不 要 过 多 的 使 用 它们 银 。 


















































镶 如 果 一 个 月 超过 了 1 次 的 使 用 这 些 怪 异 的 模式 〈or die 除外 )， 即 被 认为 是 过 多 的 使 用 了 。 








10. 10 练习 

















答案 参见 附录 和 A: 
1. [5] 写 一 个 程序 ， 能 重复 要 求 用 户 猜 测 某 个 在 1 到 100 之 间 的 数字 ， 直 到 猜 对 为 止 。 你 的 程序 应 当 能 随机 的 产生 一 个 
































数字 ， 使 用 公式 int(1 + rand 100) 争 。 当 用 户 猜 测 错误 时 ， 程 序 应 该 回应 “Too high” 或 者 “Too low”"。 如 果 用 户 输入 quit 
或 exit， 或 者 回 车 时 ， 程 序 应 立即 退出 。 如 果 用 户 猜 测 正确 ， 程 序 也 退出 。 


















































争 如 果 不 了 解 这 些 函数 ， 可 以 参见 perlfunc 帮助 手册 中 关于 int 和 rand 的 部 分 。 
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第 十 一 章 文件 检验 





早 些 时 候 ， 我 们 介绍 了 怎样 打开 一 个 文件 句柄 进行 输出 。 通 常 ， 这 会 创建 一 个 新 的 文件 ， 如 果 存 在 同名 的 文件 ， 则 同名 文 
件 会 被 覆盖 掉 。 很 可 能 ， 你 需要 检查 是 否 存在 同名 的 文件 。 或 者 想 知道 某 个 文件 存在 多 和 久 。 亦 可 能 想 知道 大 小 大 于 某 个 数 
值 且 一 定时 间 内 没 被 访问 的 文件 。Perl 提供 了 完备 的 方法 来 对 这 些 文件 信息 进行 检测 。 




















1 . 工 文件 检测 操作 

















如 果 程 序 会 建立 新 的 文件 ， 在 程序 创建 新 文件 之 前 ， 我 们 应 先 确定 是 否 存 在 同名 的 文件 ， 以 免 重 要 数据 被 镍 盖 掉 。 对 于 这 
种 问题 ， 我 们 可 以 使 用 -e 选项 ， 检 测 是 否 存在 相同 名 字 的 文件 ; 

















die“Oops!Afile called '$filename'” already exists\n” 


让 -~e $filename; 











我 们 在 die 消息 中 没有 使 用 $!， 因 为 这 里 不 是 系统 拒绝 请 求 。 下 例 检查 文件 是 否 被 更 新 。 在 本 例 中 ， 我 们 检测 一 个 已 经 打 
开 的 文件 句柄 ， 而 非 文 件 名 。 假 设 程序 的 配置 文件 每 周 或 两 周 就 需要 被 更 新 。( 可 能 是 检查 计算 机 病毒 。) 如 果 文 件 在 过 去 
28 天 内 都 未 被 修改 ， 则 什么 地 方 出 问题 了 : 
































warn Config file is looking pretty oldlm” 
让 -M CONFIG > 28; 








第 三 个 例子 有 些 复 杂 。 假 设 磁盘 空间 快 被 填 满 了 ， 我 们 不 打算 购买 更 多 的 人 磁盘， 而 是 决定 将 那些 大 的 且 没 用 的 文件 移 到 备 
份 磁 带 上 去 。 因 此 我 们 首先 检查 文件 列表 争 ， 找 到 那些 大 于 100KB 的 文件 。 如 果 一 个 文件 仅 是 很 大 ， 我 们 不 一 定 会 将 其 移 
到 备份 磁带 上 去 ， 除 非 同时 其 在 最 近 90 天 内 都 未 被 访问 。( 因 此 我 们 知道 这 些 文件 不 常用 ) 多 : 
























































急 更 可 能 的 情况 是 ， 不 是 将 文件 名 的 列表 读 入 一 个 数组 (如 我 们 的 例子 中 )， 而 是 直接 使 用 glob( 目 录 句 柄 (directory handle))， 这 将 在 第 十 二 
壮 介 绍 。 由 于 我 们 还 没 学 习 到 它 ， 因 此 这 里 就 使 用 上 述 方法 。 













































































争 对 于 这 个 例子 ， 本 章 结束 处 有 一 个 更 有 效 的 解法 。 


my @ariginal_files = qw/ fred barney betty Wilma pebbles dino bam-bamm /; 
my @big_old_files; “# 要 移 到 备份 磁带 上 的 文件 
foreach my $filename (@original_files){ 





push @big_ old_files, $filename 
让 -s $filename > 100_100 and -A $filename > 90; 


} 














这 是 第 一 次 出 现 ， 你 可 能 已 注意 到 foreach 循环 的 控制 变量 前 使 用 了 my。 这 声明 其 作用 域 为 循环 内 ， 因 此 本 例 中 亦 可 以 使 
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j use strict。 














廿 





如 果 没 有 使 月 








日 wzy 这 个 关键 字 ， 那 可 能 使 ) 
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全 局 变量 $filename 。 




















检测 文件 的 选项 看 起 来 是 由 连接 线 〇 和 
返回 true/false 值 ， 




















但 有 

















个 字母 组 成 ， 字 母 指 测试 的 类 型 ， 后 接 被 测试 的 文件 名 或 文件 句柄 。 大 多 数 选 项 











少数 例外 。 参 见 表 11-1， 其 中 包括 完整 的 列表 ， 下 面 还 有 一 些 针 对 特殊 例子 的 讨论 。 














表 LI 文件 检测 选项 及 其 含义 


















































































































































































































































































































































检测 选项 含义 

工 文件 或 目录 对 此 《有效 的 ) 用 户 〈effective user) 或 组 是 可 读 的 
-W 文件 或 目录 对 此 《有 效 的 ) 用 户 或 组 是 可 写 的 

广 文件 或 目录 对 此 《有 效 的 ) 用 户 或 组 是 可 执行 的 

-0 文件 或 目录 由 本 《有 效 的 ) 用 户 所 有 

及 文件 或 目录 对 此 用 户 (real usen 或 组 是 可 读 的 

-W 文件 或 目录 对 此 用 户 或 组 是 可 写 的 

尺 文件 或 目录 对 此 用 户 或 组 是 可 执行 的 

-O 文件 或 目录 由 本 用 户 所 有 

习 文件 或 目录 名 存在 

-2 文件 存在 ， 大 小 为 0〈 目 录 恒 为 false) 

-S 文件 或 目录 存在 ， 大 小 大 于 0〈 值 为 文件 的 大 小 ， 单 位 : 字 节 ) 
二 为 普通 文本 

-d 为 目录 

-| 为 符号 链接 

-S 为 Socket 

了 为 管道 (Entry is a named pipe(a'“fifo”) 

二 为 block-special 文件 〈 如 挂 载 磁 盘 ) 

民 为 character-special 文件 (如 IO 设备 ) 

忆 setuid 的 文件 或 目录 

-g setgid 的 文件 或 目录 

卡 File or directory has the sticky bit set 

苇 文件 句柄 为 TITY( 系 统 函 数 isatty0 的 返回 结果 ; 不 能 对 文件 名 使 用 这 个 测试 ) 
< 文件 有 些 像 “ 文 本 ”文件 

-了 文件 有 些 像 “二进制 ”文件 

-M 修改 的 时 间 【〈 单 位 : 天 ) 

-A 访问 的 时 间 《〈 单 位 : 天 ) 

-C 索引 节点 修改 时 间 〈 单 位 : 天 ) 











荆 -由 区 以 及 -0 检测 相应 的 属性 对 effective user 或 group ID 
过 查看 文件 的 权限 位 (permission bits )。 如 果 你 的 系统 使 | 
上 其 权限 ， 但 # 
犹如 x 对 于 某 个 空 文 们 








这 些 选 项 检 涡 


急 -0 和 -O 
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为 true， 但 











j 户 争 。 这 些 检测 通 











是 否 为 真 ， 它 是 指 实际 负责 运行 此 程序 的 





















































j 访 问 控制 列表 (Access Control Lists(ACLs)), 则 这 些 测试 就 使 用 它 。 
非 说 这 种 操作 一 定 能 进行 的 。 例 如 ，-w 对 于 CD-ROM 上 的 一 个 文件 是 true， 但 你 并 不 能 写 入 ， 
其 实际 上 是 不 可 执行 的 。 












































只 和 user ID 有 关 ， 和 group ID 无 关 。 
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急 对 于 高 阶 学 4 
用 


和 








和 公 了 
= 条 


如 果 程 序 非 





Unix 文件 系统 争 包 括 几 种 类 型 
指 同 某 个 文件 ， 则 -f 和 -1 均 返 
链接 的 讨论 





II 


寻 


于 符 


争 许 多 non-Unix 文 伯 





Perl 语言 入 门 (第 


来 讲 ，-R, -W, -X -0， 针 对 real user 或 group ID， 这 在 程序 执行 了 set-ID 就 非常 重要 。 如 果 那 样 ， 
。 参 看 一 本 高 级 的 Unix 编程 书籍 中 关于 set-ID 程序 讨论 的 部 分 。 











S 返 

















)。 


回 true， 但 这 是 一 种 特殊 类 型 的 true。3 


J4， 分 别 可 有 上, -d, -1 -$, -p, b， 以 及 -c 检测。 任何 一 种 必 
加 true。 因 此 如 果 想 知道 








《如 挂 载 磁盘 )。 


时 间 检 测 ，-M，-A，-C ( 鬼 大 写 ) ， 返 
文件 内 容 外 的 所 有 信息 。 查 看 stat 系 统 调 
得 到 2.00001 这 样 的 值 
1:30am， 如 果 你 在 半夜 前 30 分 钟 对 文件 进行 了 修 


多 在 non-Unix 系统 中 ， 有 些 可 能 不 同 ， 











当 检 查 文件 的 时 间 时 ， 可 能 得 至 


系统 也 是 这 村 




















加 系统 最 后 一 次 















































文件 创建 的 时 间 〈Unix 并 不 

















生 ， 但 并 非 每 一 检测 项 在 任何 系统 中 都 能 执行 。 例 如 ， 你 的 non-Unix 系统 中 可 能 就 没 


j 的 用户 手册 ， 或 含有 Unix 内 部 细节 的 书籍 。) 这 些 值 是 为 浮 ， 
， 如 果 文 件 是 在 两 天 又 一 秒 前 被 修改 。 这 些 “ 天 数 (days) ”和 我 们 通 向 的 计算 法 不 同 。 例 如 ， 现 在 是 
改 ， 则 -M 得 到 的 值 大 约 为 0.1， 虽 然 是 在 “昨天 ”修改 的 。 





四 版 ) 











这 通常 是 指 请 求 运行 的 























其 为 文件 的 大 小 ， 单 位 为 字 节 ， 当 非 0 时 被 认为 真 。 











中 


于 其 


忌 





| 


个 符 号 链接 
hh 有 更 多 的 关 


到 








中 之 一 。 如 果 有 
进行 检测 〈 在 第 十 二 章 上 














卫 
人 XE 


























否 为 符号 链接 ， 应 当先 对 








本 block special 文件 




















聊 改 ， 访 问 ， 以 及 索引 节点 被 修改 到 现在 的 天 数 旬 。( 索 引 市 点 包括 除 
类 型 ， 因 此 可 能 


NS 



































因为 它们 使 ) 





计时 法 可 能 和 Unix 使 月 
这 个 时 间 ) 而 非 索 引 节点 改变 的 时 间 。 得 看 perlport 的 帮助 手 


上 














的 不 同 。 例 如 ， 在 某 
册 。 


系统 ，ctime 段 〈-C 查看 的 地 方 ) 是 

















j 负 值 如 -1.2， 其 含义 是 最 近 一 次 访问 时 间 是 大 约 30 小 时 后 。 此 时 间 刻 度 的 0 点 是 程序 开始 


运行 的 时 间 争 ， 因 此 这 个 值 可 能 是 指 一 个 运行 了 很 长 时 间 的 程序 检测 一 个 刚 被 访问 过 的 文件 。 或 者 时 间 《〈《 有 意 或 无 意 的 ) 
被 设置 成 了 将 来 某 个 时 刻 。 


银 被 存储 在 $^T 这 个 变量 中 ， 你 可 以 更 新 它 《〈 使 | 





工 和 -B 分 别 检测 











一 个 文 们 





中 ) 标明 其 为 二 进 








字 节 , 进行 合理 的 


可 能 这 些 字符 中 
进 





你 可 能 认为 -T 和 -B 选项 的 结果 是 不 一 致 的 ， 因 为 一 个 文本 文件 不 可 
们 完全 相同 。 如 果 文 件 不 存在 
的 文件 ， 即 可 以 说 是 空 的 文本 文件 ， 也 可 以 说 是 如 


、I 





STDIN 返 
盘 中 。 





不 要 担心 ， 如 果 你 不 知道 其 余 检测 项 的 含义 ， 你 可 能 并 不 需要 它们 。 如 果 你 很 想 知道 ， 可 以 找 一 本 Unix 纺 
h， 这 些 检测 项 尽量 模拟 Unix 系统 中 的 返回 结果 ， 如 果 没 有 这 个 选项 ， 则 返 





non-Unix 系统 
为 。) 
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判 文 件 。 这 当然 不 算 完 美 ， 如 








猜测 。 如 果 没 有 太 多 的 怪 

















鲍 Ar 吕 ! 


开 们 三 ， 











日 


日 可 








本 而 女 











E， 或 者 不 可 读 ， 则 两 个 均 为 false， 因 为 其 既 不 是 文本 文件 也 不 是 二 进 
的 二 进 制 文 件 ， 此 时 则 同 为 true。 





给 定 的 文件 句柄 是 一 个 TTY 时 ，+ 文件 检测 项 返 
回 aue 时 ， 通 常 其 含义 是 可 以 交互 式 的 询问 有 


jy$AT = time;)， 如 果 需 


知道 的 呢 
则 其 像 文本 。 这 有 时 会 判断 错误 , 如 文本 中 有 大 量 的 瑞典 语 或 法 语 单 ( 词 
鸭 高 位 被 设置 了 ， 有 些 像 IO-8859 的 变种 ， 或 者 是 Unicode 编码 ) ， 这 可 能 让 Perl 错误 的 
将 源 文 件 和 编译 后 的 文 伯 
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EL - 
2 








-个 不 同 的 开始 时 间 。 








是 文本 的 还 是 二 进 制 的 。 但 对 文件 系统 了 解 的 读者 知道 其 中 没有 位 《至 少 在 Unix-like 操作 系统 
制 还 是 文本 文件 ， 那 Perl 是 怎 村 





Ar 过 日 
? 答案 是 





Perl 欺骗 了 我 们 : 它 打开 一 个 文件 ， 查 看 前 面 儿 千 个 











各 它们 判断 为 二 
F ， 这 些 检测 能 够 做 到 。 














F ， 抑 或 HTML 文件 和 了 PNGs 区 别 天 








作 已 一 … 
能 是 二 


进 旬 





判 文件 ， 反 之 亦 然 ， 但 存在 两 种 特殊 情况 ， 
| 文件 。 同 时 ， 一 个 





蔬 
空 





十 


中 

















管道 


王 
三 j 


读 入 ， 而 非 键 





AI 





回 true， 表 明 它 是 
户 问题 。 如 果 为 false， 则 你 的 程序 可 能 从 文件 或 





可 交互 的 ， 因 为 它 不 是 一 个 简单 的 文件 或 


旧址. 


呈 








o 



































程 的 书 


所 。 
你 能 猜测 其 


一 














村 下 











回 undef。 通 常 ， 
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如 果 省 略 掉 文 件 名 或 文件 句柄 这 个 参数 (也 就 是 说 只 有 = 或- 这 个 参数 )， 其 默认 的 参数 是 $_ 中 的 文件 名 银 。 因 此 ， 要 检测 列 
表 中 哪些 文件 是 可 读 的 ， 可 以 如 下 书写 : 





























银 -t 文 件 检测 是 一 个 例外 ， 因 为 它 对 文件 名 是 无 效 的 《它们 永远 都 不 可 能 是 TTYs。 ) 默认 时 ， 其 检测 STDIN 。 











foreach(@lots_of filenames){ 
print “$_is readable" 证 一 # 同 -$_ 
} 











如 果 省 略 掉 了 某 些 参数 , 确保 紧 跟 在 文件 检测 项 后 面 的 不 像 通常 的 参数 。 例 如 , 如 果 希 望 文件 大 小 的 单位 是 KB , 而 非 字 节 ， 
你 可 能 将 -s 的 返回 值 除 以 1000〈 或 1024)， 如 : 




















# 文 件 名 在 $_ 中 
my $size_in_ K=-S/1000;  #Oops! 





引 


Perl 解析 器 看 见 正 斜 线 (1)， 它 并 不 将 它 看 作 除 号 。 由 于 现在 在 给 -s 找 一 个 可 选 的 操作 数 〈 参 数 )， 它 看 到 的 是 茶 个 像 由 
正 斜 线 作 为 分 隔 符 的 正则 表达 式 的 开端 部 分 。 为 了 避免 这 种 混淆 ， 在 文件 检测 部 分 加 上 括号 : 























my $size_in_k = (-s) / 1024; # 使 用 默认 的 $_ 





明确 给 出 被 检测 的 文件 参数 将 更 加 安全 。 

















11.， 2 stat 和 lstat 函数 








虽然 这 些 检测 项 可 以 很 好 的 给 出 文件 或 文件 句柄 相应 参数 的 属性 ， 但 它们 还 没有 包括 所 有 的 信息 。 例 如 ， 它 们 不 能 给 出 文 
件 的 连接 数 ， 或 者 所 有 者 的 user ID(uid) 。 要 得 到 文件 的 其 余 信 息 ， 可 以 使 用 stat 函数 ， 其 返回 Unix 系统 调用 stat 时 相同 的 
值 〈 比 你 想 知道 的 还 多 ) 争 。 返 回 值 或 者 是 空 列表 ， 表 明 stat 失败 〈 通 常 是 由 于 文件 不 存在 ); 或 者 是 13 个 元 素 的 列表 ， 
使 用 下 例 可 以 容易 的 说 明 : 






























































旬 在 non-Unix 系统 中 ，stat 和 lstat， 以 及 文件 检测 dile tests), 将 返回 “最 接近 的 可 用 值 ”。 例 如 ， 如 果 系 统 没 有 user IDs (那样 ， 按 照 Unix 
的 观点 ， 系 统 只 有 一 个 “用 户 ”)， 则 user 和 group IDs 的 返回 值 可 能 是 0， 就 像 只 有 一 个 用 户 : 系统 管理 员 。 如 果 stat 和 lstat 失败 ， 
则 返回 空 列表 。 如 果 文 件 检测 file tests) 失 败 〈 或 者 给 定 的 系统 中 不 可 用 )， 则 返回 undef。 查 看 perlport 的 用 户 手 册 了 解 最 新 的 关于 不 同 
系统 之 间 的 区 别 。 























































































































my ($dev, $ino, $mode, $nlink, $uid, $gid, $rdev, $size, $atime, $mtime, $ctime, $blksize, $blockes) 
= Stat($filename); 





























这 些 名 字 表 明了 stat 返回 的 值 的 含义 ， 在 statC) 的 用 户 手册 中 有 详细 描述 。 下 面 是 其 中 一 些 重 要 部 分 的 说 明 : 


gdev 天 9ino 





文件 的 设备 号 和 索引 节点 号 。 它 们 组 成 了 文件 的 “牌照 (license plate)”。 即 便 它 有 多 个 名 字 〈 便 连接 (hard link))， 设 
备 号 和 索引 市 点 号 的 组 合 仍 是 唯一 的 。 
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111ode 














文件 的 权限 位 以 及 一 些 其它 的 位 。 如 果 使 用 过 Unix 命令 ls -1 来 得 到 文件 的 详细 信息 ， 其 每 一 行 由 类 似 于 -rwxr-xr-x 开 
头 。 这 些 字母 以 及 连接 线 〈9 个 ) 争 是 指 文件 的 权限 ， 它 们 对 应 于 $mode 中 最 不 重要 的 位 ， 在 本 例 为 0755。 其 它 位 ， 
除了 这 最 低 的 9 位 外 ， 是 指 文件 的 其 余 信 息 。mode 需要 将 它 和 本 章 后 面 的 位 操作 结合 起 来 使 用 。 













































































争 上 述 字符 串 中 第 一 个 字符 不 是 权限 位 。 它 指 其 类 型 ; - 是 指 普通 文本 ，d 指 目录 ， 而 1 是 指 符号 连接 ， 还 有 些 别 的 。l1s 命令 从 其 它 位 而 
非 这 9 个 权限 位 判断 其 类 型 。 















































17112710 大 





文件 或 目录 的 〈 硬 ) 连接 数 。 是 指 被 检测 项 真实 名 字 的 个 数 。 对 于 目录 其 值 总 是 2 或 者 更 大 的 数 ， 而 对 于 文件 〈 通 常 ) 
是 1。 我们 将 在 第 十 二 章 中 讨论 建立 文件 的 连接 ， 到 你 你 将 更 清楚 。 对 于 ls -1， 其 为 紧 接 权限 位 串 的 数字 。 
































guid 条 ggid 





指 文件 所 有 权 的 userID 及 group ID。 


size 





返回 其 大 小 ， 单 位 : 字 节 ， 同 -s 文件 检测 项 相同 。 
ga1ize， gtie， 有 及 gctire 


这 三 个 时 间 ， 它 们 按照 系统 的 时 间 格 式 : 32 位 ， 表 示 从 某 个 时 刻 到 现在 所 经 过 的 秒 数 ， 这 个 时 刻 是 记录 系统 时 间 的 一 
个 任意 值 。 在 Unix 和 别 的 某 些 系 统 中 ， 这 个 时 刻 从 世界 时 间 1970 年 第 一 个 午夜 开始 ， 但 在 菜 些 系统 中 ， 这 个 时 刻 可 
能 不 同 。 本 章 后 面 有 更 多 的 关于 如 何 将 时 间 转 换 为 有 用 格式 的 信息 。 










































































当 stat 的 参数 是 符号 连接 时 ， 其 返回 的 信息 是 此 符号 连接 指向 的 实体 的 信息 ， 而 非 符号 连接 本 身 的 信息 ， 除 非 此 符号 连接 
所 指向 的 内 容 不 能 被 访问 。 如 果 需 要 得 到 〈 儿 乎 是 没 用 的 ) 符号 连接 本 身 的 信息 ， 可 以 使 用 lstat 代替 stat 〈 它 按照 相同 的 
顺序 返回 同样 的 值 )。 如 果 其 操作 数 不 是 符号 连接 ， 则 lstat 和 stat 返回 的 值 相同 。 









































同文 件 检测 (file tests) 一 样 ，stat 和 lstat 的 默认 参数 为 $_ ， 意 指 stat 系统 调用 将 针对 $_ 所 对 应 的 文件 进行 操作 。 





11. 3 localtime 函数 





当 有 一 个 时 间 戳 (imestamp) 时 《如 stat 中 的 )， 其 格式 有 些 像 1180630098 。 这 对 你 没 多 少 用 ， 除 非 你 将 两 个 时 间 戳 相 减 。 
你 可 能 需要 将 它们 转换 为 容易 阅读 的 形式 ， 如 “The May 31 09:48:18 2007”。Perl 可 以 在 标量 context 中 使 用 localtime 函数 
做 到 ; 

















my $timestamp = 1180630098; 


my $date = localtime $timestamp; 
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在 列表 context 中 ，localtime 返回 一 列 值 ， 其 中 某 些 值 可 能 并 非 你 所 预料 的 : 


my($sec, $min, $hour $day $mon, $year $wday, $yday, $isdsb) 


= localtime $timestamp; 


























$mon 是 一 个 表示 月 份 的 数字 ， 范 围 是 0 到 11， 其 在 月 份 名 字 的 数组 中 作为 索引 值 是 比较 方便 的 。$year 是 指 从 1900 到 现 
在 的 年 份 数 ， 因 此 ， 需 要 加 上 1900 来 得 到 实际 的 年 数 。$wday 的 值 是 从 0 〈 星 期 天 ) 到 6 〈 星 期 六 )，$yday 指 一 年 中 的 具 
体 天 数 (从 0 (1 月 1 日 ) 到 364 或 365 (12 月 31))。 





























还 有 两 个 相关 的 函数 也 经 常用 到 。gmtime 函数 同 localtime 一 样 ， 除 了 其 返回 的 形式 为 是 世界 时 间 〈 曾 经 被 叫做 格林 威 治 时 
间 )。 如 果 想 从 系统 中 得 到 当前 的 时 间 ， 可 使 用 time 函数 。localtime 和 gmtime 在 默认 的 情况 下 都 使 用 time 的 当前 值 ， 如 果 
没 提供 参数 : 














my $now = gmtime; # 得 到 当前 的 时 间 





要 得 到 更 多 的 处 理 日 期 外 时 间 的 信息 ， 可 以 参见 相应 的 模块 信息 。 





11. 4 位 操作 


如 果 需 要 对 数字 的 位 进行 操作 , 如 处 理 stat 返回 的 mode 位 , 则 需要 位 操作 符 。 它们 对 值 进行 二 进 制 操作 。 按 位 与 操作 符 ( 信 ) 
返回 操作 符 左 边 和 右边 相应 位 操作 的 结果 。 例 如 ， 表 达 式 10 & 12 的 值 为 8 。 按 位 与 操作 只 有 在 两 个 操作 数 中 相应 位 的 值 均 
为 1 时 其 结果 才 为 1。 因 此 10〈 二 进 制 : 1010) 和 12 (1100) 的 按 位 与 操作 的 结果 是 8 〈1000， 仅 在 两 个 操作 数 中 对 应 得 
位 均 为 1 时 结果 才 为 1)。 参 看 图 11-1。 














图 11-1 按 位 与 操作 


表 11-2 介绍 其 它 位 操作 的 含义 。 


表 11-2 位 操作 





表达 式 含义 











10 皮 12 按 位 与 ， 当 操作 数 相应 位 均 为 1 时 结果 为 1 〈 本 例 结果 为 8) 
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10112 按 位 或 ， 当 操作 数 中 相应 位 有 一 个 为 工 则 结果 为 1《〈 本 例 结果 为 147 

项 4 下 按 位 异 或 ， 当 操作 数 中 相应 位 有 且 仅 有 一 个 为 1， 结 果 才 为 1〈 本 例 结果 6) 

6<<2 位 左 移 ， 将 左边 操作 数 左 移 右边 操作 数 所 指定 的 位 数 ， 被 移出 的 位 置 (右边 ) 补 0《〈 结 果 为 24) 

25 >>2 位 右 移 ， 将 左边 操作 数 右 移动 右边 操作 数 所 指定 的 位 数 ， 丢 弃 多 余 的 位 数 〈 左 边 )〈 本 例 结果 位 6) 

~10 位 取 反 ， 也 叫做 一 元 位 补 运算 ;其 返回 值 为 操作 数 中 相应 位 取 反 的 值 (本 例 为 0Xfffffff5 ,这 和 具体 情况 
有 关 ) 











下 例 对 stat 返回 的 Smode 进行 处 理 。 这 些 位 处 理 的 结果 对 chmod 是 有 用 的 ，chmod 将 在 第 十 二 章 中 介绍 : 









































# $mode 是 对 CONFIG 进行 stat 操作 所 返回 的 mode 值 
warn “Hey, the configuration file is world-writablelm ” 











让 $mode 允 0002， # 安 全 问题 
Imy $classcial_mode = 0777 廊 $mode; # 尾 额外 的 高 位 屏蔽 掉 
my $u_plus_Xx = $classical mode 10100; # 尾 其 中 一 位 置 1 
my $go_minus T= $classical mode 妇 (~ 0044); # 谷 两 位 置 0 


11. 4. 1 使 用 位 串 





所 有 的 位 操作 符 都 可 以 对 位 哩 和 整数 进行 操作 。 如 果 操 作 数 是 整数 ， 则 结果 为 整数 。( 整 数 至 少 有 32 位 ， 可 能 更 大 ， 如 果 
你 的 系统 支持 。 因 此 ， 在 64 位 机 器 上 ，~10 得 到 的 是 64 位 的 结果 : 0Xfffffffffffffffffffg， 而 非 32 位 的 结果 : OXfffffff5。) 























但 如 果 位 操作 符 的 操作 数 为 字符 串 ，Perl 会 将 其 作为 位 串 进 行 处 理 。 因 此 ，'AxAA”1'%x55” 得 到 的 结果 是 “xFF"。 注 意 这 些 
操作 数 是 单字 节 字 符 串 ， 其 结果 也 为 一 个 字 节 〈8 位 )。 位 串 可 以 是 任意 长 的 。 
































这 是 Perl 中 少数 儿 个 需要 区 别 字符 串 和 数字 的 地 方 之 一 。 参 见 perlop 用 户 手册 了 解 更 多 的 关于 字符 串 上 位 操作 的 信息 。 


HL. S$ 使 用 特殊 的 下 划 线 文件 句柄 


每 当 在 程序 中 使 用 stat, lstat， 或 文件 检测 (file tesb 时 ，Perl 就 会 要 求 系统 分 配 一 块 stat buffer 给 文件 (也 就 是 ，stat 系统 调用 
所 返回 的 buffen 。 这 就 意味 着 如 果 想 知道 文件 是 否 是 可 读 且 可 写 的 ， 需 要 对 相同 的 信息 进行 两 次 系统 调用 ， 这 在 系统 资源 
充裕 的 条 件 下 ， 不 会 有 什么 问题 。 





















































这 看 起 来 是 当 费 时 间 争 ， 我 们 可 以 避免 它 。 当 对 _ 这 个 文件 句柄 〈 此 操作 数 为 单个 下 划 线 ) 进行 文件 检测 (file tesb，stat， 
或 lstat 操作 时 ， 将 要 求 Perl 对 前 一 个 文件 检测 (file tesb, stab 或 lstat 函数 的 操作 数 进 行 操 作 ， 而 非 再 一 次 的 进行 系统 调用 。 
有 时 这 是 危险 的 : 一 个 子 程序 可 以 在 你 不 知情 的 情况 下 调用 stat， 这 会 将 你 的 buftfer 覆 靖 掉 。 如 果 小 心 些 ， 可 以 节约 不 必要 
的 系统 调用 ， 使 得 程序 运行 更 快 。 下 例 是 关于 将 文件 移 到 备份 磁带 的 例子 ， 我 们 使 用 了 刚 学 到 的 技巧 : 





















































急 因 为 系统 调用 相对 更 慢 。 











my @original_files = qw/ fred barney betty Wilma pebbles dino bam-bammn/; 
my @big_old_files; # 需 要 移 到 备份 伐 带 上 去 的 文件 
foreach(@orginal_files){ 
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push @big old_files,$_ 
让 (-S) > 100_100 and -A_> 90; 


第 一 次 检测 时 使 用 了 罗 认 的 变量 $_。 这 也 更 加 有 效率 《可 
了 _ 这 个 文件 句柄 。 这 次 检测 中 ， 使 用 第 一 次 检测 的 文 们 









































对 文件 句柄 进行 检测 不 同 于 对 $_ 进 行 检测 。 
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# 比 以 前 的 方法 效率 高 














使 有 


能 除了 对 程序 员 之 外 )， 他 从 操作 系统 中 得 到 数据 。 第 二 次 检测 使 
的 大 小 信息 ， 这 是 我 们 所 需要 的 。 
































日 $_， 可 能 每 一 次 的 值 均 不 同 ， 其 为 当前 $_ 中 得 值 ， 使 用 _ 是 为 了 解决 




















1. 





复 调用 系统 的 问题 。 这 又 是 一 个 对 完全 不 同 的 函数 使 用 相 




















以 名 字 的 例子 。 

















[15] 写 一 个 程序 ， 读 入 命令 行 中 的 一 串 文 件 ， 报 告 其 是 否 可 读 ， 可 写 ， 可 执行 ， 或 不 存在 。( 提 示 : 如 果 一 个 函数 能 一 








次 对 一 个 文件 进行 所 有 的 检测 将 非常 有 帮助 。) 如 果 一 个 文件 被 执行 了 chmod 0 操作 ,将 报告 什么 ? 《在 Unix 系统 中 ， 











chmod 0 some_file 将 一 个 文件 变 成 不 可 读 ， 不 可 写 ， 不 
有 的 普通 文件 。 也 就 是 说 ， 可 以 输入 像 /exl1-1* 这 样 的 命令 ， 返 回 当前 目录 下 文件 的 属性 。 








可 执行 的 ) 在 大 多 数 shell 中 ， 星 号 〈*) 表示 当前 目录 中 的 所 








2 [10] 写 一 个 程序 ， 找 出 命令 行 中 存在 时 间 最 长 的 文件 名 ， 并 报告 其 天 数 。 当 参数 为 裤 时 ， 其 行为 如 何 〈 例 如 ， 命 令 行 











中 没有 输入 任何 的 文件 ) ? 
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第 十 二 章 目录 操作 
前 面 章节 的 例子 中 的 文件 和 程序 在 同一 个 目录 下 面 。 但 当代 操作 系统 将 我 们 的 文件 按照 目录 来 管理 ， 允 许 我 们 将 Beatles( 披 


头 士 ， 著 名 乐队 ， 译 者 注 ) 的 MP3 和 我 们 本 书 的 材料 存放 在 不 同 的 目录 中 ， 防 止 我 们 不 小 心 将 MP3 当 作 本 书 的 材料 发 给 出 
版 商 。Perl 允许 你 直接 管理 这 些 目录 ， 这 些 程序 在 操作 系统 之 间 移 植 也 是 相当 容易 的 。 


12. 工 在 目录 树 上 移动 


程序 在 某 个 工作 目录 (working directory) 下 运行 ， 这 是 相对 路 径 的 起 点 。 也 即 是 说 ， 如 果 指 fred， 其 含义 是 “当前 工作 目录 
下 的 fred。” 





























一 




































































chdir 可 以 改变 工作 目录 。 它 和 Unix shell 下 的 cd 命令 类 似 ; 


chdir “yetc”or die“cannot chdir to /etc: $!7”; 











于 这 是 系统 请 求 ， 错 误 发 生 时 将 给 变量 $ 赋 值 。 通 常 应 当 检查 $! 的 值 ， 因 为 它 将 告诉 你 chdir 失败 的 原因 。 



































工作 目录 会 被 Perl 启动 后 的 所 有 进程 所 继承 〈 我 们 在 第 十 四 章 将 更 详细 的 讨论 )。 但 是 ， 对 于 调用 Perl 的 进程 的 工作 目录 
将 不 会 改变 ， 例 如 shell 争 。 因 此 ， 不 能 写 一 个 Perl 程序 来 代替 shell 下 的 cd 命令 。 

















急 这 种 限制 不 是 来 源 于 Perl; 它 是 Unix, Windows， 以 及 其 它 操 作 系统 的 一 种 特性 。 如 果 想 改变 shell 的 工作 目录 ， 参 见 你 的 shell 的 文档 。 

















如 果 参 数 省 略 掉 了 , Perl 尝试 将 你 的 主 目录 Chome directory) 作 为 工作 目录 , 这 和 在 shell 中 使 用 cd 命令 不 带 参 数 时 是 类 似 的 。 
这 古 少 数 几 种 在 忽略 掉 参 数 而 不 使 用 变量 $_ 的 情形 之 一 。 





























某 些 shell 允许 你 在 cd 后 面 的 参数 前 加 上 ~，, 来 使 用 其 他 用 户 的 主 目录 作为 当前 目录 (例如 cd ~merlyn)。 这 是 shell 的 功能 ， 
而 非 操 作 系统 的 ， 而 Perl 直接 调用 操作 系统 。 因 此 ，~ 前 缀 对 chdir 无 效 。 























12. 2 Globbing 














通常 ，shell 将 每 个 命令 行 中 的 任何 的 文件 名 模式 转换 成 它 所 匹配 的 文件 名 。 这 被 称 作 g1opping 。 例 如 ， 在 echo 命令 后 使 用 
了 文件 名 模式 *.pm，shell 会 将 它 转换 成 它 所 匹配 的 文件 名 : 





$ echo *.pm 
barney.pm dino.pm fred.pm wilma.pm 


$ 











echo 命令 不 需要 知道 如 何 展开 *.pm，shell 将 展开 它 : 
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$cat >show-args 

foreach $args (@ARGV){ 
Print“one arg is $arg\n” 

} 

AD 

$perl show-args *.pIm 

one arg is barney.pm 

one arg is dino.pm 

one arg ls fred.pm 

one afg is wilma.pm 

$ 

show-args 不 需要 知道 如 何 进 行 globbing， 这 些 名 字 已 经 被 处 理 后 存在 @ARGYV 中 了 。 


















































有 时 在 Penl 程序 的 内 部 使 用 像 *pm 这 样 的 模式 。 我 们 可 以 轻易 的 将 它 转换 为 它 所 匹配 的 文件 名 吗 ? 是 的 ， 只 需要 使 用 glob 
操作 : 


my @all_files = glob “ee”"; 
IDyY Q@pm_files 一 -1 glob 0 








@allL_files 得 到 了 当前 目录 下 的 所 有 文件 ， 这 些 文件 按照 字母 排序 的 ， 不 包括 由 点 〈.) 开头 的 文件 。@pm_files 和 前 面 在 命 
令 行 中 使 用 .pm 的 例子 所 得 到 的 结果 相同 。 

















任何 可 在 命令 行 中 是 使 用 的 ， 均 可 作为 glob 的 〈 单 个) 参数 ， 包 括 用 空格 分 隔 开 的 多 个 模式 : 


my @all_files_including_dot = glob“. 溯 交 ; 




















这 里 ， 我 们 包括 了 额外 的 “点 星 号 〈.*)” 参 数 ， 来 得 到 所 有 的 文件 (由 点 开头 的 文件 ， 以 及 不 由 点 开头 的 文件 )。 引 号 中 两 
个 项 之 间 的 空 隔 是 必须 的 争 。 这 在 Perl V5.6 之 前 的 版 本 中 能 工作 的 原因 是 ，glob 调用 [Dirvcesjn 急 进行 扩展 的 操作 。 由 于 这 个 
原因 ，glob 是 一 个 耗 时 的 操作 ， 例 如 进入 大 型 目录 或 其 它 的 情况 。 尽 责 的 Perl 黑客 会 避免 使 用 glob 来 对 目录 进行 操作 ， 这 
将 在 后 面 的 章节 讨论 。 但 是 ， 如 果 使 用 最 近 版 本 的 Perl， 那 并 不 是 需要 关心 这 个 问题 。 




















































































































册 





争 Windows 用 户 习惯 于 使 用 “*” 来 表示 “所 有 的 文件 ”。 但 其 含义 是 “所 有 的 名 字 中 包含 点 的 文件 ” 其 











在 Windows 上 的 Perl 。 
































急 或 者 其 等 效 的 代替 者 ， 如 果 没 有 C-shell 的 话 。 


12. 3 Globbing 的 替换 语法 

















昌 然 我 们 任意 的 使 用 globbing 这 个 术语 ， 我 们 也 谈论 glob 操作 ， 但 在 许多 使 用 globbing 的 程序 中 并 没有 出 现 glob 这 个 字 
眼 。 为 什么 呢 ? 原因 是 ， 许 多 这 类 代码 在 glob 操作 被 命名 前 就 写 好 了 。 它 使 用 一 对 尖 括 号 (<> )， 和 从 文件 句柄 读 入 操作 
类 似 : 


























my @all_files = <*>; ” 禁 基 本 上 同 @all_files = glob "一 样 ; 
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尖 括 号 中 的 值 同 双 引 号 中 的 值 一 样 ， 会 被 内 插 。 其 含义 是 指 在 glob 之 前 ，Perl 变量 会 被 其 当前 值 所 蔡 换 : 









































my $dir = “yetc”; 
my @dir files = <$dir* $dir/.*>; 


这 里 ， 我 们 从 指定 的 目录 中 得 到 所 有 的 文件 名 (有 点 的 和 没 点 的 文件 )， 因 为 $dir 被 转换 成 了 当前 的 值 。 














日 于 尖 括 号 的 含义 可 以 指 从 文件 句柄 读 入 或 globbing ，Perl 怎么 判断 使 用 哪 一 个 操作 呢 ? 如 果 尖 括号 之 间 是 一 个 严格 意义 
上 的 标识 符 ， 则 其 为 文件 句柄 读 入 操作 ， 和 否则 ， 为 globbing 操作 。 如 下 例 ; 











my @files = <FRED/#>; 村 glob 

my @lines = <FRED>; 峰 文 件 句柄 读 入 
my $name =“FRED”; 

my @files = <$name/*> 夺 glob 














一 个 例外 情况 是 ， 如 果 尖 括号 中 是 一 个 简单 的 标量 变量 〈 不 是 hash 或 数组 中 的 一 个 元 素 )， 它 就 是 一 个 间接 的 文件 句柄 读 
入 操作 〈indirectjijehandle read) 争 ， 变 量 的 内 容 给 出 了 要 读 入 的 文件 句柄 的 名 字 

















急 如 果 间 接 文件 句柄 (indirect handle) 是 一 个 文本 串 ， 那 就 属于 “符号 引用 (symbolic reference)” 在 use strict 下 ， 这 种 操作 会 被 禁止 。 当 然 ， 
间接 文件 句柄 (indirect handle) 也 可 能 是 tyepglob 或 IO 对 象 的 引用 (reference) ， 此 时 在 use strict 下 是 可 以 的 。 



































my $name = “FRED”; 
my @lines = <$name>; 并 间接 的 文件 句柄 读 入 操作 














判断 其 为 glob 或 文件 句柄 操作 是 在 山 译 时 完成 的 ， 因 此 其 独立 于 变量 的 具体 内 容 。 














如 果 需 要 ， 可 以 使 用 readline 得 到 间接 文件 句柄 读 入 的 操作 人 争 ， 让 其 看 起 来 更 加 清晰 : 











争 如 果 使 用 的 Perl 的 版 本 是 5.005 之 后 的 。 


my $name =“FRED”; 
my @lines = readline FRED; # 从 FRED 读 入 
my @lines = readline $name; # 从 FRED 读 入 




















日 readline 操作 并 不 常用 ， 因 为 间接 文件 句柄 读 入 操作 并 不 常见 ， 且 通常 只 是 针对 简单 的 标量 变量 进行 。 


> 





12. 4 目录 句柄 


从 给 定 目录 得 到 其 文件 名 列表 的 方法 还 可 以 使 用 目录 句柄 (directory Pandle)。 目 录 句 柄 外 形 及 其 行为 都 很 像 文件 句柄 。 打 
开 《〈 使 用 opendir 而 非 open)， 从 中 读 入 《使 用 readdir 而 非 readline)， 关 闭 〈《 使 用 closedir 而 非 close)。 不 是 读 入 文件 的 内 
容 ， 而 是 将 一 个 目录 中 的 文件 名 《〈 以 及 一 些 其 它 东 西 ) 读 入 ， 如 下 例 : 
























































my $dir_to_process = “etc”; 
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opendir DH, $dir_to_process or die“Cannot open $dir_to_process: $”; 
foreach $file(readdir DHD { 
print “one file in $dir_ to_process is $file\n”; 


} 
closedir DH; 

















同文 件 句 柄 一 样 ， 目 录 句 柄 会 在 程序 结束 时 自动 关闭 ;或 者 当 目录 句柄 被 重新 打开 而 指向 吃 一 个 目录 时 ， 也 会 自动 关闭 。 






































在 Perl 以 前 的 版 本 中 ，globbing 它 会 调用 别 的 进程 ， 目 录 句 柄 不 会 ， 因 此 它 更 有 效率 ， 能 更 有 效 的 利用 系统 资源 。 但 是 ， 
这 是 一 种 底层 (lower-level) 的 操作 ， 意 指 我 们 需要 自己 处 理 更 多 的 事情 。 























以 





例如 ， 返 回 的 文件 名 没有 特定 的 顺序 争 。 返 回 列表 包括 所 有 的 文件 ， 不 仅仅 是 匹配 上 某 个 特定 模式 的 《如 globbing 例子 
的 *.pm) 的 文件 名 。 这 些 列表 含有 所 有 的 文件 名 ， 包 括 点 〈.) 文件 ， 以 及 由 点 () 开 头 ， 或 点 点 (.) 开 头 的 文件 名 争 。 因 此 ， 
如 果 只 想 要 以 pm 结尾 的 文件 ， 我 们 可 以 在 循环 内 部 使 用 一 个 选择 函数 : 





























急 这 是 没有 排序 的 结果 ， 类 似 于 使 用 ls -或 find 得 到 的 顺序 。 














镶 不 要 像 以 前 许多 的 Unix 程序 那样 ， 错 误 的 嘉定 ， 点 〈.) 文件 以 及 点 点 〈..) 文件 是 最 先 返回 的 两 个 值 〈 排 序 或 没 排序 )。 如 果 你 不 以 前 
不 知道 ， 那 忘掉 我 们 刚才 说 的 ， 因 为 这 个 假定 是 错误 的 。 事 实 上 ， 我 们 已 经 后 悔 在 这 里 提 到 它 了 。 





机 



































while ($name = readdir DIR) { 
next unless $name =~ 八 pmyq/; 


... Inore processing... 


} 











上 述 的 语法 是 正则 表达 式 而 非 gob。 如 果 想 要 所 有 的 非 点 non-dot) 文件 (不 是 由 点 开头 的 文件 )， 可 以 使 用 : 








next 让 $name =~ / 八 ./; 





如 果 想 要 除了 通常 的 点 〈 当 前 目录 ) 以 及 点 点 《〈《 父 目录 ) 之 外 的 所 有 文件 ， 我 们 可 以 明确 地 使 用 下 面 的 语句 : 
next if$name eq “2” or $name eq “2”; 


现在 我 们 讨论 最 容易 混淆 的 部 分 ， 请 打 起 精神 来 。readdir 操作 返回 的 文件 名 没有 路 径 名 部 分 ， 而 只 是 文件 名 。 因 此 ， 我 们 
的 得 到 的 不 是 /etcmpasswd 而 是 passwd。 由 于 这 又 是 一 个 不 同 于 globbing 的 地 方 ， 人 们 也 经 党 在 这 里 出 现 混淆 。 




















你 需要 将 路 径 名 加 上 ， 以 得 到 文件 的 全 名 “〈 路 径 名 + 文件 名 ): 


< 


opendir SOMEDIR, $dirname or die “Cannot open $dqirname: $!”; 
while (my $name = readdir SOMEDIR) { 





next 让 $name =~ /NA./; # 跳 过 点 文件 
$name = “dirname/$name”; # 加 上 目录 名 
next unless -f $name and -rname; # 除 非 是 可 读 文 件 
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如 果 没 有 加 上 目录 名 ， 则 测试 部 分 将 具 检测 当前 目录 下 的 文件 ， 而 不 是 $dirmname 下 的 文件 。 这 是 使 用 目录 句柄 最 常 犯 的 一 


个 错误 。 

















12. S$ 递归 的 目录 列表 


你 在 最 初 的 Perl 生涯 中 可 能 并 不 需要 递归 目录 操作 。 我 们 不 是 将 丑陋 的 记 rd Perl 脚本 呈现 在 你 面前 ， 而 是 告诉 你 Per 有 一 
个 叫做 File::Find 的 库 ， 通 过 它 你 可 以 对 递归 的 目录 进行 处 理 。 我 们 这 里 告诉 你 的 原因 是 ， 不 希望 你 自己 书写 这 样 的 一 个 程 
序 , 因 为 许多 Perl 程序 员 有 了 几 十 个 小 时 的 经 验 后 ,就 喜欢 进行 这 一 类 的 处 理 , 然 后 陷入 困 卉 , 困惑 于 “local directory handles” 
以 及 “how do Ichange my directory back?" 等 。 















































12. 6 操作 文件 和 目录 


Perl 通常 用 来 处 理 文件 和 目录 。 由 于 Perl 产 生 于 Unix， 如 今 它 的 大 多 数 应 用 仍 在 这 上 面 ， 因 此 本 章 许多 描述 看 起 来 都 是 以 
Unix 为 中 心 的 。 但 一 个 好 消息 是 ， 只 要 有 可 能 ，Perl 在 non-Unix 系统 上 几乎 有 相同 的 行为 。 





















































12. 7 删除 文件 


许多 时 候 ， 我 们 创建 文件 来 让 数据 能 保留 一 段 时 间 。 但 是 ， 如 果 文 件 不 再 需要 时 ， 则 需要 将 它 删除 。 在 Unix shell 中 ， 我 们 
可 以 使 用 rm 命令 将 单个 文件 或 一 批文 件 删除 : 























$rm slate bedrock lava 


在 Perl 中 ， 我 们 使 用 unlink: 





Unlink “slate” “bedrocke “ava”; 


这 个 操作 将 这 三 个 文件 送 入 了 比特 天 和 尝 〈 意 指 将 它们 删 掉 了 ， 译 者 注 )， 它 们 将 不 会 被 看 见 了 。 





























于 unlink 以 一 个 列表 作为 操作 ， 而 glob 返回 列表 ， 因 此 可 以 将 它们 结合 起 来 ， 一 次 删 掉 多 个 文件 : 








unlink glob“ 兴 .0”; 











这 类 似 于 shell 中 的 rm *.o 命令 ， 除 了 我 们 不 需要 局 动 一 个 rm 进程 。 因 此 ， 可 以 更 快速 的 删除 这 些 文件 。 








unlink 返回 值 告诉 我 们 成 功 删 除 的 文件 数 。 回 到 第 一 个 例子 ， 我 们 可 以 检验 其 是 否 成 功 : 








my $successful = unlink “slate” “bedrock”“lava”; 


Print“I deleted $successful file(s) just nowAnD”; 
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当然 ， 如 果 数 字 为 3， 则 它 将 所 有 的 文件 均 删 除了 ， 如 果 为 0， 则 一 个 也 没 删 除 。 如 果 为 1 和 2 呢 ? 那 没 有 线索 表明 那些 文 
件 删除 了 。 如 果 想 知道 ， 你 可 以 使 用 循环 ， 一 次 针对 一 个 文件 来 处 理 : 











foreach my $file (qw(slate bedrock lava)) { 
unlink $file or warn “failed on $file: $\n”; 


} 











由 于 一 次 只 删除 一 个 文件 , 则 其 返回 值 为 0( 失 败 ) 或 1 (成 功 )， 它 看 起 来 像 一 个 Boolean 值 ， 控制 着 是 否 执行 warn。or warn 
类 似 于 or die， 除 了 其 不 是 fatal 外 〈 人 参见 第 五 音 )。 这 里 ， 在 warn 的 消息 后 加 入 了 换行 符 ， 因 为 这 不 是 我 们 程序 的 bug 所 
引起 的 。 





























当 某 个 特定 的 unlink 失败 时 ，$! 变 量 会 被 设 成 相应 的 操作 系统 错误 ， 我 们 将 它 包 含 在 消息 之 中 。 这 只 在 一 次 针对 一 个 文件 
名 进行 处 理 时 才 有 效 ， 因 为 下 一 个 操作 系统 错误 会 重 置 它 。 你 不 能 使 用 unlink 来 删除 一 个 目录 同 不 能 简单 的 使 用 rm 来 
删除 一 个 目录 一 样 )。 如 果 要 那样 做 ， 可 以 使 用 即将 介绍 的 rmdir 函数 。 





























这 里 有 一 个 鲜 为 人 知 的 Unix 事实 。 你 可 以 有 一 个 文件 不 可 读 ， 不 可 写 ， 不 可 执行 ， 甚 至 你 并 不 拥有 它 ， 例 如 属于 别人 的 ， 
且 你 仍然 可 以 删除 它 。 这 时 因为 unlink 一 个 文件 的 权限 同文 件 本 身 的 权限 是 没有 关系 的 ; 它 和 目录 所 包含 的 文件 权限 有 关 。 









































一 























我 们 提 到 这 一 点 的 原因 是 ， 许 多 初级 的 Perl 程序 员 ， 在 实验 unlink 的 课程 中 ， 创 建 一 个 文件 ， 使 用 chmod 将 其 设 为 0 〈 因 
此 既 不 可 读 ， 也 不 可 写 ), 来 检查 unlink 是 否 失 败 。 事 实 上 它 一 点 都 不 抱 外 的 就 消失 了 争 。 如 果 你 想 unlink 失败 ， 试 试 删除 
[etcjpasswd 或 者 类 似 的 系统 文件 。 由 于 这 是 一 个 由 系统 管理 员 控 制 的 文件 ， 你 没有 能 力 删 除 它 争 。 

































































争 某 些 人 知道 rm 通常 会 提示 你 是 否 删除 这 一 类 的 文件 。 但 rm 是 一 个 命令 ， 而 unlink 是 系统 调用 。 系 统 调 用 从 不 询问 权限 ， 它 们 也 从 不 道 
歉 说 自己 错 了 。 























争 当 然 ， 如 果 笨 到 以 系统 管理 员 的 身份 登陆 上 去 进行 这 类 操作 ， 那 能 得 到 你 想 要 的 结果 。 














12. 8 重 命名 文件 


将 一 个 给 定 文件 重 命名 可 以 很 简单 的 使 用 rename 函数 做 到 : 




















3?? 


Tename “old”“new”; 














命名 为 new， 且 在 同一 个 目录 中 。 甚 至 可 以 在 不 同 的 目录 之 间 操 作 : 














这 类 似 于 Unix 的 my 命令 ， 将 一 个 叫做 old 的 文件 


























TIename “over_there/some/place/some _file ”some _file”; 





这 将 另 一 个 目录 下 叫做 some _file 的 文件 移 到 当前 的 目录 ， 确 保 运 行程 序 的 用 户 有 适当 的 权限 争 。 同 许多 请 求 系统 调用 的 函 
数 一 样 ，rename 返回 false 如 果 失 败 ， 可 以 设置 $! 来 得 到 操作 系统 错误 ， 因 此 可 以 《通常 因 该 说 是 应 该 ) 使 用 or die( 或 者 or 
warn) 来 将 这 些 报告 给 用 户 。 


















































这些 文 件 必须 在 同一 个 文件 系统 中 。 在 本 章 稍 后 的 地 方 将 介绍 为 什么 会 有 这 条 限 表 











4 
四 
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一 个 在 Unix shell 用 法 的 新 闻 组 中 频繁 争 出 现 的 问题 是 ， 怎 样 将 所 有 的 以 old 结尾 的 文件 重 名 命名 为 以 .new 结尾 的 文件 。 











下 面 是 Perzl 的 做 法 ; 























争 这 不 是 唯一 的 一 个 经 常 询问 的 问题 ， 怎 样 一 次 将 一 批文 件 
是 第 一 个 回答 的 问题 。 直 到 现在 ， 它 仍然 占据 第 一 的 位 置 。 








命名 是 在 这 些 新 闻 组 中 最 常 问 的 。 这 也 是 在 大 多 数 新 闻 组 的 FAQ 



































foreach my $file (glob“*.old”){ 
my $newfile = $file; 
$newtfile =~ SN.old$/new/; 
让 (-e $newfile){ 
warn can'trename $file to $newfile: $newfile exists\n”; 
jelsif(rename $file, $newfile){ 
桥 成 功 ， 什 么 也 不 做 
} else { 
warn 'Tename $file to $newfile failed: $\Nn7” 
} 





jh ， 这 通常 


检测 是 否 存在 $newfile 的 文件 是 需要 的 ， 因 为 rename 将 会 立刻 重 命名 某 个 文件 ， 无 论 是 否 存在 同名 的 文件 ， 假 定 用 户 有 权 
限 将 以 前 的 文件 删除 。 我 们 在 这 里 进行 检测 的 目的 ， 就 是 减少 这 类 情况 所 引起 的 信息 丢失 。 如 果 想 要 替换 一 个 已 经 存在 的 


























文件 ， 如 wima.new， 则 不 需要 使 用 检测 。 


循环 中 的 前 两 句 可 以 结合 〈 通 常 这 样 ); 


(my $newfile = $file) =~ SA.old/.new/; 











这 名 申明 了 $newfile, 将 $file 的 值 赋 给 它 作 为 初始 值 ， 并 对 $newfile 进行 更 改 。 你 可 以 将 它 读 作 “ 将 $file 用 右边 的 方法 进行 























蔡 换 ， 将 其 结果 赋 给 $newfile。” 是 的 ， 由 于 优先 级 的 关系 ， 括 号 是 必须 的 。 


某 些 程序 员 第 一 次 看 到 替换 时 会 猜想 为 什么 左边 需要 反 斜 线 (\) 而 右边 不 需要 。 这 两 部 分 不 是 对 称 的 : 蔡 换 的 左边 部 分 是 


























一 个 正则 表达 式 ， 而 右边 是 一 个 双 引 号 括 起 来 的 字符 串 。 因 此 我 们 使 用 模式 人 old$/ 表 示 “ 以 .old 结尾 的 字符 串 ”( 是 











因为 我 们 不 希望 在 第 一 次 匹配 时 就 进行 蔡 换 : petioldLold)， 而 右边 ， 我 们 可 以 只 用 .mew 进行 奉 换 。 








12. 9 连接 和 文件 


结尾 的 ， 








如 果 知 道 Unix 的 文件 和 目录 模型 ， 将 有 助 于 你 了 解 更 多 的 文件 和 目录 的 知识 ， 无 论 你 的 non-Unix 系统 是 否 按 这 种 方式 工 
作 。 和 以 前 一 样 ， 我 们 这 里 只 是 介绍 其 中 的 一 部 分 ， 想 要 了 解 更 多 的 信息 ， 可 以 参照 介绍 Unix 内 部 细节 的 优秀 书籍 。 






























































挂 载 卷 〈7mormied volume) 是 一 个 硬盘 驱动 器 〈 或 者 任何 其 它 类 似 的 ， 如 磁盘 分 区 ， 软 盘 ，CD-ROM， 或 DVD-ROM)。 它 
可 能 包含 任意 数量 的 文件 和 目录 。 每 一 个 文件 被 存 入 一 个 被 编号 的 索引 节点 (Cnode) 里 ， 可 以 把 它 想象 成 磁盘 上 的 一 个 块 。 

















一 个 文件 可 能 存放 在 inode 613， 而 另 一 个 可 存放 在 inode 7033。 














要 定位 某 个 文件 ， 需 要 在 目录 中 碍 找 它 。 目 录 是 一 种 特殊 类 型 的 文件 ， 由 系统 维护 。 本 质 上 ， 它 是 一 个 文件 名 字 以 及 其 索 
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引 节 点 号 的 表 争 。 目 录 中 除开 
点 ”)， 它 是 当前 











于 其 


生生 
才 
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它 的 , 有 两 个 特殊 的 目录 。 一 个 是 ， 





个 是 叫做 cpicjpen 
引 节 点 613 
目录 有 三 个 文件 〈 包 括 cpickem 























急 在 Unix 系统 中 〈 其 它 系统 











试 一 下 命令 如 ls -ail。 如 果 给 定 的 文件 系统 中 多 个 项 中 有 两 个 或 多 个 索引 节点 号 相同 ， 那 么 实际 上 只 有 一 个 文件 ， 





一 份 文件 。 


 ， 而 目录 在 索引 节点 919 








P 。 目录 
) 和 两 个 目录 














通常 没有 索引 节点 (inode) ， 硬 连接 (hard link) ， 等 )。 可 以 在 ls 命令 后 使 月 


( 叫 作 < 点”), 它 是 当前 目录 的 名 字 ; 还 有 一 个 . 
录 的 上 一 级 目录 〈 也 就 是 ， 当 前 目录 的 父 目 录 ) 争 。 图 12-1 提 舍 








(5 点 
S 了 一 个 描述 了 两 个 索引 节点 的 图 。 








的 文件 ， 另 一 个 是 Barneys's 的 目录 poems，Aomze[parmaeypoe1zs， 它 包含 cpicken 这 个 文件 。 文 件 存在 索 
自身 的 名 字 ， DOE111S， 没有 在 图 
中 之 一 是 当前 目录 ， 索 引 节 点 为 919)， 以 及 每 一 个 相应 的 索引 节点 号 。 


中 








因为 它 被 存放 在 另 一 个 目录 中 。) 





现 ， 








昌 -i 参数 来 查看 文件 的 索引 节点 号 。 



































急 Unix 系统 的 根 目 录 没 
































。 在 这 个 目录 里 ，. 同 











三 出 
生 

















图 12-1. 





inode 613 





的 ， 他 们 均 指 系统 的 根 












































和 东 。 





和 蛋 之 前 的 鸡 (The chicken before the egg) 


inode 919 | 





AJurassic chicken named Meg 919 

With two beaks, three wings, and one leg 本 8002 
As her third eye she winked， dodgson 7033 
Quoth“T11 soon go extinctb chicken 013 

ButTll lay first a cubical egg.2” abacus 11320 














当 在 给 定 的 目录 中 添加 新 文件 时 ， 系 统 中 新 
有 效 呢 ? 每 一 个 索引 节点 包含 一 个 数字 ， 被 叫做 连接 数 〈jik coxnD。 如 果 没 有 在 任何 目录 中 上 


| 揭 _- 
昌 





个 











小 




















果 索 引 贡 点 的 连接 数 为 0， 则 


卫 文 件 可 以 使 用 它 。 当 索引 节点 被 添加 到 目录 吕 


目 ， 包 含 文件 名 以 及 新 的 索引 节点 。 系 统 





似 
VAN 


怎么 知道 某 个 索引 节点 是 否 
8 现 ， 则 连接 数 为 0， 因 此 如 























P， 则 连接 数 增加 当 从 列表 中 删除 时 ， 连 接 





数 减 少 。 对 于 刚才 介绍 的 cpicken 这 个 文件 ， 连 接 数 1 在 索引 节点 数据 的 右上 面 。 
































但 其 


些 索引 节点 存在 不 同 点 。 例 如 ， 我 们 已 经 知道 每 一 个 有 











录 者 

















少 为 2: 一 次 昌 
因为 这 些 子 目录 都 会 包含 .人 。 


的 个 数 争 。 一 个 普通 文件 的 索引 点 在 一 个 目录 上 


8 现在 父 目 录 的 列表 中 ， 


次 出 现在 
在 图 12-1 中 ， 目 录 | 


自身 的 列表 上 
的 索引 点 2 





























的 link 函数 创建 了 一 个 新 的 连接 : 










































































包括 . ， 而 它 指向 自 
 。 另外， 如 果 它 有 子 目 录 ， 则 每 一 个 将 增加 一 个 连接 数 ， 
现在 数据 的 右上 方 。 连 接 数 是 这 个 索引 节点 的 真实 名 字 
可 以 出 现 多 次 吗 ? 当然 可 以 。 假 设 在 上 述 的 目录 中 ，Barney 使 用 了 Pen 


身 的 索引 节点 。 因 此 目录 的 连接 数 至 




































































人 这 暗示 了 一 个 目录 的 连接 数 等 于 2 加 上 其 包含 的 子 目 录 的 个 数 。 在 某 些 系统 中 这 是 对 的 ， 但 也 有 些 系统 可 能 有 不 同 的 处 理 方式 。 
急 一 般 1 -1 的 输出 中 ， 硬 连接 数 出 现在 权限 位 (如 -rwxrxrx) 的 右边 。 现 在 你 知道 为 什么 目录 的 值 大 于 1 而 普通 文件 通常 为 1 的 原因 了 。 


?9 


link “chicken” ”egg 
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Or Warn“Can't link chicken to egg: $!”; 


这 和 在 Unix 的 shell 提示 符 后 输入 In chicken egg 的 结果 是 差不多 的 。 如 果 link 成 功 ， 则 返回 true。 如 果 失 败 ， 则 返回 false， 
并 将 失败 的 原因 赋 给 $!， 巴 尼 (Barney) 就 能 从 中 查看 失败 的 原因 。 当 运行 完 上 述 程序 后 ，esg 是 文件 cjicken 的 别名 ， 反 过 来 
说 也 对 ; 没有 一 个 名 字 比 另 一 个 更 真 ， 并 且 《 你 可 能 猜想 ) 需要 花 些 功夫 才能 知道 哪 一 个 先 出 现 。 图 12-2 演示 了 这 种 新 情 
况 ， 其 中 有 两 个 连接 到 索引 节点 613。 
























































图 12-2 egg 连接 到 cjpickem 





inode 613 








inode 919 





AJurassic chicken named Meg 919 
With two beaks, three wings, and one leg 交 8002 
Asher third eye She winked， dodgson 7033 
Quoth 工 11 soon go extinct， chicken 013 
ButTll lay first a cubical egg.” abacus 11320 
egg 013 





这 两 个 文件 名 均 指 向 磁盘 中 的 同一 块 地 方 。 如 果 文 件 cpicken 包含 200 字 节 的 数据 ， 则 egsg 也 含有 相同 的 200 字 节 数据 ， 总 
共 也 只 有 200 字 节 的 数据 〈 因 为 它们 是 同一 个 文件 的 不 同名 字 )。 如 果 巴 尼 在 文件 egg 后 添加 了 一 行 新 的 文本 ， 则 这 一 行 也 
会 出 现在 cjicken 中 人 急 。 如 果 巴 尼 不 小 心 〈 或 者 故意 的 ) 删除 了 cjicken， 其 数据 也 不 会 丢失 ， 因 为 仍然 可 以 通过 egg 得 到 。 
其 中 也 包含 着 cpicken 的 内 容 。 当 然 ， 如 果 把 它们 两 个 都 删除 了 ， 则 数据 将 丢失 争 。 这 里 还 有 一 条 关于 目录 中 连接 的 规则 ; 
给 定 目录 中 的 索引 节点 数 同 其 挂 载 卷 mounted volume) 上 的 索引 节点 数 是 一 致 的 争 。 这 条 规则 保证 了 ， 如 果 物 理 介 质 〈 可 能 
是 磁盘 ) 被 移植 到 另 一 台 机 器 上 时 ， 所 有 的 目录 和 文件 仍 在 相应 的 地 方 。 这 也 是 你 可 以 使 用 rename 将 一 个 目录 下 的 文件 移 
到 另 一 个 目录 ， 但 这 两 个 目录 必须 是 在 同一 个 文件 系统 中 ( 挂 载 卷 上 )。 如 果 它 们 在 不 同 的 磁盘 上 上， 系统 需 要 
节点 的 数据 ， 这 种 操作 对 于 一 个 简单 的 系统 调用 来 讲 太 复 杂 了 。 


































































































新 安置 索引 












































争 如 果 想 试验 创建 连接 和 改变 文件 内 容 , 需要 注意 的 是 许多 文本 编辑 器 不 会 直接 修改 原文 件 并 保存 ,而 是 将 其 保存 在 一 个 修改 的 副本 之 中 。 


如 果 巴 尼 打 算 用 文本 编辑 器 修改 egg, 则 很 可 能 得 到 一 个 新 文件 egg8， 以 及 cjickenr， 两 个 不 同 的 文件 ， 而 不 是 同一 个 文件 的 两 个 连接 。 















































急 虽 然 系统 也 许 不 会 立刻 


























写 这 个 索引 节点 ， 但 当 连 接 数 变 成 0 时 ， 没 有 简单 的 方法 来 恢复 其 数据 。 你 最 近 做 了 备份 吗 ? 











人 一 个 例外 是 特殊 的 ..， 卷 的 根 目录 ， 它 指向 安装 此 卷 的 目录 。 



































连接 的 另 一 个 限制 是 不 能 给 目录 创建 新 的 名 字 ， 因 为 目录 是 按照 层级 的 方式 安排 的 。 如 果 你 可 以 改变 它 ， 工 具 程 序 如 .rd 
和 pwd 在 文件 系统 中 将 迷失 方向 。 

















因此 ， 不 能 针对 目录 使 用 连接 ， 它 们 也 不 能 在 不 同 的 挂 载 卷 之 间 使 用 。 笠 运 的 是 ， 有 一 种 新 方法 能 打破 连接 的 这 种 限制 一 
使 用 一 种 不 同 的 连接 : 符号 连接 (sympojic JiaK) 争 。 符 号 连接 (也 被 叫做 软 连接 (sop jj 昌 , 以 区 别 于 真 或 硬 连 接 (pard Jpajs)) 
是 目录 中 的 一 种 特殊 实体 ， 告 诉 系统 到 其 它 的 地 方 去 找 。 证 我 们 假设 巴 尼 ( 在 前 面 的 poems 目录 下 操作 ) 使 用 Perl 的 syslink 
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数 创建 了 一 个 符号 连接 ， 如 下 : 





旬 某 些 老式 的 Unix 系统 不 支持 符号 连接 (sysmlinks)， 但 这 些 系统 如 今 已 不 常见 。 


Symlink “dodgsom carrol] 


Or Warn“Can't SySsmlink Dodgson to carroll: $ 呈 ; 











这 同 巴 尼 在 shell 中 使 用 ln -s dodgson carroll 的 结果 是 一 样 的 。 图 12-3 











演示 了 其 结果 ， 包 括 索 引 节 点 7033 中 的 诗歌 。 


现在 如 果 巴 尼 选 择 阅读 omre/[parneypoemzwcarro11, 这 和 从 Moreparnreypomewydodsgsozr 中 得 到 的 结果 一 样 的 ,因为 系统 会 自 


动 从 符号 连接 中 转 过 去 。 这 个 新 名 字 不 是 文件 的 “ 真 ” 名 ， 因 为 “如 你 在 图 











为 符号 连接 告诉 系统 ,“ 如 果 查 找 carro， 现 在 应 当 离开 ， 而 去 找 dodgsom 。” 














中 所 见 ) 索引 节点 7033 的 计数 仍 为 1。 这 是 因 


符号 连接 可 以 自由 的 跨越 不 同 的 文件 系统 ， 可 以 给 目录 新 的 名 字 ， 而 便 连 接 (hard link ) 做 不 到 。 符 号 连接 可 以 指向 任何 的 


文件 名 ， 一 个 在 这 个 目录 ， 一 个 在 另 一 个 目录 ， 甚 至 是 不 存在 的 文件 。 
失 ， 因 为 软 连接 和 连接 数 无 关 。 如 果 巴 尼 想 删除 dodgsonr， 系 统 则 不 能 




















为 false。 它 是 个 符号 连接 ， 但 其 并 不 存在 。 







































































12-3 索引 节点 7033 的 一 个 符号 连接 


inode 7033 恩 inode 919 











Yet what are all such gaieties to me 919 
Whose thoughts are full of indices 8002 
and surds7 dodgson 7033 
chicken 613 
x+7x+53 abacus 11320 
egg 013 
=11/3 carroll->dodgson 





争 有 删除 carro1 仅仅 是 删除 这 个 符号 连接 〈sysmlink )。 
























































日 这 也 意味 着 软 连 接 不 能 像 便 连接 那样 防止 数据 丢 
再 从 符号 连接 中 得 到 相应 的 数据 争 。 虽 然 这 里 还 有 
ca17o11， 从 中 读 取 数据 将 得 到 像 file not found 这 样 的 错误 信息 。 文 件 检 测 -1l“carroll" 的 结果 为 tue， 但 





ecarrol" 的 结 








于 符号 连接 可 以 指向 一 个 不 存在 的 文件 ， 因 此 和 它 也 可 以 在 创建 文件 时 使 用 。 巴 尼 的 大 多 数 文件 存放 在 他 的 主 目录 中 ， 


mo1ae[pazey 但 它 也 党 访问 另 一 个 目录 ,其 名 字 特 别 长 ， 难 于 输入 : [socaWoptWsystettpd [ootdewusyerystag 训 8[Da1TIeX/ 























cebi。 因 此 ， 他 设置 了 一 个 符号 连接 ore[panreyyry_st 太 来 指向 前 面 的 长 名 字 ， 现 在 能 很 容易 的 访问 它 了 。 如 果 他 创 
建 了 一 个 新 的 文件 〈 在 他 的 主 目录 下 ) 叫做 wy_stu1powling， 这 个 文件 的 真实 名 字 是 [psV1ocaopysystewi1ttpd/oot-dewiuser 
F 移 到 Msr1ocaVopWipternattpadow-devwipsyerwy 


S10g1118[Da111eXWcgiDiDowj1 加 。 下 周 ， 系 统管 理 员 将 巴 尼 的 这 些 文 从 


























1ageij8s[ammeyXcgsibi， 巴 尼 重 新 定位 符号 连接 ， 他 的 所 有 程序 仍 能 很 容易 的 在 新 的 地 方 找到 文件 。 














通常 ， 你 的 系统 中 的 ppsrBDizperl，Amsriocapinper1， 或 者 两 个 均 是 符号 连接 ， 连 接 到 你 的 系统 中 Perl 的 真实 目 
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到 新 版 本 的 Perl 中 变 得 很 容易 。 假 如 你 是 系统 管理 员 ， 安 装 了 新 的 Perl， 同 时 希望 老 的 Penl 仍 能 使 用 ， 因 为 你 不 想 带 来 任 
何不 便 。 当 准备 好 升级 时 ， 你 改变 这 些 符 号 连接 ， 每 一 个 使 用 #WusrVbin/perl 开头 的 程序 使 用 新 版 本 的 Perl。 此 时 ， 你 可 以 
蔡 换 以 前 指向 旧版 本 的 Perl 的 符号 连接 。( 如 同 任何 优秀 的 管理 员 一 样 , 在 升级 前 应 当 告 诉 你 的 用 户 在 hsrpipemL-7.2 上 测 
试 他 们 的 代码 ,告诉 他 们 在 这 一 个 月 的 升级 期 间 他 们 仍 能 使 用 老 版 本 的 Per 只 需 将 第 一 行 改作 #l/usVbin/perl-6.1， 如 果 需 要 
的 话 。) 
































可 能 让 人 惊奇 的 是 ， 硬 和 软 连接 均 是 有 用 的 。 许 多 non-Unix 操作 系统 一 个 都 没有 ， 这 种 缺失 让 人 很 强烈 的 感受 到 了 。 在 某 
些 non-Unix 系统 中 ， 符 号 连接 可 能 被 当 作 “快捷 方式 〈shortcubD) ”或 “alias( 别 名 )” 来 实现 的 。 查 看 Perlport 的 用 户 手册 了 
解 最 新 的 信息 。 





























要 找 出 符号 连接 指 疝 的 地 方 ， 使 用 readlink 函数 。 它 会 告诉 你 符号 连接 指向 的 地 方 ， 如 果 参 数 不 是 符号 连接 其 返回 undef: 











my $where = Teadlink'“carroll”; # 得 到 “dodgson” 
my $perl = readlink“/usrlocalbin/perl”# 可 能 得 到 Perl 放置 的 地 方 





























可 以 使 用 unlink 删除 任意 类 型 的 连接 。 现 在 ， 你 知道 这 个 操作 为 什么 得 到 这 个 名 字 了 吧 。unlink 删除 目录 中 给 定 文件 名 的 
实体 ， 符 号 连接 减 1， 也 有 可 能 释放 掉 相 应 的 索引 接点 。 

















12. 10 创建 和 删除 目录 


在 一 个 目录 下 创建 新 目录 是 很 容易 的 。 使 用 mkdir 函数 ; 














mkdqdir'“fred”0755 or warn “Cannot make fred directory: $; 


true 意味 着 成 功 ，$! 会 在 失败 时 被 置 值 。 











第 二 个 参数 ，0755 是 什么 意思 呢 ? 这 是 给 新 创建 目录 设置 的 初始 权限 争 〈 你 总 是 可 以 在 后 面 修改 )。 其 值 是 用 一 个 八进制 
值 进 行 设 置 的 ， 因 为 这 个 值 会 被 当 作 Unix 权限 值 进行 解释 ， 而 它 是 按照 一 个 组 含有 3 个 bit 的 值 来 进行 的 ， 而 八进制 数 表 
示 它 非常 恰当 。 是 的 ， 甚 至 在 Windows 或 MacPerl 上 ， 使 用 mkdir 函数 也 需要 对 Unix 权限 有 所 了 解 。 权 限 0755 是 一 个 好 
的 选择 ， 因 为 它 让 你 有 所 有 的 权限 ， 而 其 他 用 户 只 有 读 的 权限 ， 不 能 进行 任何 修改 。 















































急 通 常 权 限 值 由 umask 值 进行 修改 。 参 照 umask(2) 了 解 更 深入 的 信息 。 


























mkdir 函数 不 需要 你 按照 八进制 值 进行 设 定 。 他 只 是 寻找 一 个 数字 【 纯 数 字 ， 或 计算 表达 式 )， 除 非 你 能 立刻 指出 八进制 的 
0755 是 十 进 制 的 493， 那 最 好 让 Perl 来 计算 。 如 果 不 小 心 省 略 摊 了 开头 的 0， 得 到 十 进 制 的 7$5$， 它 对 应 的 八进制 是 1363， 
这 是 个 古怪 的 权限 值 。 






































如 我 们 在 第 二 章 所 见 ， 一 个 字符 串 的 值 被 作为 数字 时 是 不 会 被 当 作 八进制 来 解释 的 ， 无 论 其 前 面 是 否 有 0。 因 此 下 面 的 不 
能 正常 工作 : 

















my $name = “fred”; 
my $permissions =“0755”; 。 # 和 危险 … 不 能 工作 
mkdir $name, $permissions; 
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噢 ， 我 们 创建 的 目录 的 权限 是 古怪 的 01363， 因 为 0755 被 当 作 十 进 制 来 解释 。 要 修正 这 种 问题 ， 可 以 使 用 oct 函数 ， 它 会 
强迫 将 某 个 字符 串 按照 八 进 制 来 解释 ， 无 论 其 前 面 是 否 有 0: 























mkdir $name, oct($permissions); 











如 果 要 在 程序 中 直接 指定 权限 值 ， 使 用 数字 来 代替 字符 串 。 需 要 oct 函数 的 情况 ， 通 常 是 此 值 来 源 于 用 户 的 输入 。 假 定 我 
们 从 命令 行 中 得 到 此 参数 : 

















my ($name, $perm) = @ARGV; #j 面 两 个 参数 是 名 字 和 权限 
mkdir $name, oct($perm) or die“cannot create $name: $!”; 

















此 处 $perm 的 值 ， 最 初 会 被 当 作 字 符 串 来 解释 ， 使 用 oct 函数 后 会 被 作为 八进制 来 解释 。 





要 删除 一 个 空 的 目录 ， 按 照 类 似 于 unlink 函数 的 方法 使 用 rmdir 函数 : 











rmdir glob“fred/*#?”; # 删 除 fred/ 下 面 所 有 的 空 目 录 





foreach my $dqdir (qw(fred barney betty)){ 
rmdir $dqdir or warn“cannot rmdir $dir: $!\n7”; 


} 





和 unlink 一 样 ，rmdir 返 回 删除 的 目录 个 数 ， 如 果 一 次 删除 一 个 ， 则 会 在 失败 时 设置 合理 的 $! 值 。 








rmdir 在 目录 非 空 时 失败 。 第 一 遍 时 ， 可 以 尝试 使 用 unlink 删除 目录 下 的 文件 ， 其 次 再 删除 现在 应 当 是 空 的 目录 。 例 如 ， 假 
设 我 们 需要 一 个 地 方 ， 当 程序 运行 时 能 写 入 大 量 的 临时 文件 : 














my $temp_dir =“/tmp/scratch_$$”; 
mkdir $temp_dir 0700 or die “cannot create $temp_dir: $”; # 基 于 进程 ID 




















# 悔 $temp_dir 作为 所 有 的 临时 文件 存放 的 地 方 


























unlink glob 'qtemp_dirv* $temp_dir.”; # 将 $temp_dir 里 面 的 文件 删 反 
Imdir $temp_dir; # 尾 现在 是 空 的 目录 删 掉 

















初始 化 的 临时 目录 名 包括 当前 的 进程 站 ， 这 对 每 一 个 运行 的 进程 均 是 唯一 的 ， 可 以 通过 变量 9$ 得 到 《类 似 于 shell)。 我 们 
这 样 做 的 目的 是 防止 和 其 它 进程 冲 突 ， 只 要 它们 也 包括 进程 ID 作为 目录 名 的 一 部 分 就 不 会 有 问题 。( 使 用 程序 名 和 进程 ID 
是 很 普遍 的 ， 因 此 如 果 程 序 叫做 quarry， 则 目录 通常 被 称 为 /mp/quarry_$$。) 












































程序 的 末端 ，unlink 删除 此 临时 目录 下 的 所 有 文件 ， 然 后 rmdir 删除 空 目 录 。 但 是 ， 如 果 我 们 在 目录 下 创建 了 子 目录 ， 那 
unlink 和 rmdir 均 失 败 。 要 得 到 更 可 靠 的 解答 ， 参 看 标准 发 布 所 附带 的 File::Path 模块 中 的 rmdir 函数 。 
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12. 1 修改 权限 


Unix 的 chomd 命令 可 以 改变 文件 或 目录 的 权限 。 同 样 的 ，Penl 的 chomd 函数 也 能 完成 这 种 任务 : 











chmod 07$3，fred ”barney ”; 











同 许多 的 同 操作 系统 接口 的 函数 一 样 ，chmod 返回 其 成 功 改变 的 个 数 ， 如 果 使 用 单个 参数 ，$! 会 被 设 成 恰当 的 失败 原因 。 
第 一 个 参数 是 Unix 权限 值 〈 甚 至 在 non-Unix 的 Perl 中 )。 基 于 我 们 在 前 面 描述 mkdir 的 原因 ， 这 个 值 通 第 是 八进制 的 。 










































































Unix 的 chomd 命令 可 以 使 用 的 符号 权限 〈 如 +x 或 go=u-w) 对 chomd 函数 是 无 效 的 争 。 





多 除非 你 从 CPAN 上 下 载 并 安装 了 File::chmod 模块 ， 它 可 以 更 新 chmod 操 作 使 之 可 以 理解 这 些 符 号 值 。 














12.， 12 改变 所 有 者 


如 果 操 作 系统 允许 ， 你 可 以 使 用 chown 函数 改变 一 批文 件 的 所 有 者 及 所 在 的 组 。 所 有 者 及 组 是 同时 改变 的 ， 它 们 两 个 分 别 
有 一 个 数字 值 user-ID 及 group-ID 。 例 如 : 



































Imy $user = 1004; 
my $group = 100; 


chown $user $group, glob“#.o7; 


如 果 你 有 一 个 像 melryn 这 样 的 用 户 名 ， 而 没有 数字 ， 怎 么 办 ?” 调用 getpwnam 函数 ,将 名 字 转 换 为 数字 ， 而 对 应 的 getgrmam 
多 将 组 名 转换 为 数字 : 


























多 这 两 个 名 字 基 本 上 是 最 丑陋 的 。 但 不 要 因为 这 责备 Larry; 因为 Berkley 的 小 子 〈 发 明 Unix 的 人 一 译 者 注 ) 是 这 样 命名 的 。 



































defined(my $user = getpwnam merlyn”) or die “bad user” 
defined(my $group = getprnam “users”) or die “bad group 
chown $user $group, glob“/home/Merlyn/”; 








defined 函数 验证 返回 值 是 否 为 undef， 如 果 请 求 的 user 或 group 不 存在， 则 返回 undef。 

















chown 函数 返回 其 改变 的 文件 的 个 数 ， 而 错误 值 被 设置 在 $! 之 中 。 
12. 13 改变 时 间 惟 
在 极 少 情况 下 ， 希 望 欺 骗 别 的 程序 ， 关 于 文件 最 近 修改 的 时 间 ， 以 及 被 访问 的 时 间 ， 你 可 以 使 用 utime 函数 来 做 到 这 些 。 


前 面 两 个 参数 给 出 最 近 访 问 时 间 ， 和 修改 时 间 ， 剩 下 的 参数 是 需要 改变 这 些 值 的 文件 列表 。 时 间 按 照 内 部 的 时 间 心 格式 (和 
我 们 在 第 十 一 章 中 提 到 的 stat 函数 返回 值 的 类 型 是 一 致 的 。) 
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一 个 时 间 戳 方便 使 用 的 值 是 “现在 Cight now)”，time 函数 返回 的 值 ， 其 格式 是 合适 的 。 更 新 当前 目录 下 的 所 有 文件 ， 使 它们 
看 起 来 是 昨天 修改 的 ， 而 访问 时 间 为 现在 ， 可 以 如 下 做 到 ; 





























my $now = time; 
my $ago = $now -24*60*60; # 一 天 的 秒 数 
utime $now, $ago, glob“” # 设 成 当前 访问 的 ， 一 天 之 前 修改 的 

















没有 什么 限制 你 创建 一 个 文件 ,其 时 间 戳 是 在 将 来 还 是 在 过 去 (但 受到 Unix 时 间 戳 值 的 限制 , 必须 在 1970 到 2038 年 之 间 ， 
或 者 你 的 non-Unix 系统 的 限制 ， 除 非 使 用 的 是 64 位 的 时 间 戳 )。 也 许可 以 使 用 它 来 创建 一 个 目录 ， 其 中 你 做 好 注释 ， 到 时 
将 写 的 小 说 传送 出 去 。 






















































































第 三 个 时 间 戳 〈ctime 的 值 ) 永远 是 “now”， 无 论 什 么 时 候 改 变 的 文件 ， 因 此 不 能 通过 使 用 utime 函数 来 设置 它 〈 当 你 设置 
它 后 ， 它 会 自动 重 壮 到 “now”)。 因 为 其 首要 的 目的 是 为 了 不 断 的 备份 : 如 果 文 件 的 ctime 比 备份 磁带 上 的 日 期 更 新 ， 则 应 
当 进 行 备份 了 。 


















































12. 14 练习 








斌 


节 的 程序 可 能 是 危险 的 。 在 一 个 空 的 目录 里 面 测试 它们 ， 尽 量 避 免 意外 的 删除 有 用 的 信息 。 

















案 参见 附录 A; 


TI 议 








1 


[12] 写 一 个 程序 要 求 用 户 输入 一 个 目录 名 ， 再 改变 到 那个 目录 去 。 如 果 用 户 输入 的 值 是 空白 ， 则 转变 到 他 /她 的 主 目录 
去 。 改 变 后 ， 将 这 个 目录 下 的 普通 内 容 《〈 不 包括 有 点 〈.) 开头 的 项 ) 按照 字母 顺序 列 出 来 。( 提 示 : 使 用 目录 句柄 还 
是 glob 更 方便 ? ) 如 果 没 有 成 功 改变 目录 ， 提 示 用 户 ， 但 不 要 尝试 输出 目录 里 的 内 容 。 










































































2. [外 修 改 程序 ， 使 之 包含 所 有 的 文件 ， 不 仅仅 是 那些 不 以 点 () 开 头 的 文件 。 


























3 [5] 如 果 你 在 前 面 的 练习 中 使 用 的 是 目录 句柄 ， 使 用 glob 





写 它 。 如 果 使 用 的 是 glob， 则 用 目录 句柄 重 写 。 








4 [6] 写 一 个 类 似 于 mm 的 程序 ， 删 除 命令 行 中 出 现 的 任何 文件 。(〈 不 需要 处 理 像 rn 中 的 选项 ) 














5 [10] 写 一 个 类 似 于 my 的 程序 ， 将 命令 行 中 的 第 一 个 参数 重 命名 为 第 二 个 参数 。( 不 需要 处 理 像 mv 中 的 选项 ， 或 别 的 
参数 。) 允许 它 是 一 个 目录 ， 如 果 是 ， 使 用 相同 的 基本 名 字 (basename)， 生 成 新 的 目录 。 



































6. [7 了 7] 如 果 你 的 操作 系统 支持 , 写 一 个 类 似 于 jn 的 程序 , 能 建立 命令 行 中 第 一 个 参数 的 硬 连 接 (hard ling 到 第 二 个 参数 。( 不 
需要 处 理 hn 的 选项 ， 或 者 更 多 的 参数 。) 如 果 系 统 没有 硬 连 接 ， 那 么 输出 一 条 消息 ， 指 出 如 果 可 行 你 将 进行 的 操作 。 
提示 : 这 个 程序 和 前 面 的 有 类 似 的 地 方 ， 注 意 到 这 一 点 能 节约 你 编码 的 时 间 。 















































7. [ 刀 如 果 你 的 操作 系统 支持 ， 修 改 上 一 个 练习 的 程序 ， 使 之 支持 -s 选项 〈 在 别 的 参数 前 面 )， 来 表明 你 想 创建 一 个 软 连 
接 (soft linlo) 而 非 (hard linl)。( 甚 至 在 你 没有 硬 连 接 的 情况 ， 你 也 有 可 能 能 创建 软 连接 。) 




















8. [7] 如 果 你 的 操作 系统 支持 ， 写 一 个 程序 来 查找 当前 目录 下 的 符号 连接 (symbolic links)， 并 将 它们 的 值 打印 出 来 (如 


-| 一 样 : name -> value )。 
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第 十 三 章 字符 串 和 排序 


Perl 被 设计 成 90% 擅 长 处 理 文本 ，10 允 处 理 其 余 的 问题 。 因 此 Perl 有 强大 的 文本 处 理 能 力 ， 包 括 正 则 表达 式 。 但 有 时 正则 
表达 式 过 于 复杂 ， 你 需要 一 种 更 简单 的 方法 来 处 理 字符 串 ， 这 将 在 本 章 介绍 。 


















































13. 工 使 用 索引 寻找 子 串 


查找 的 方法 依赖 于 查找 的 地 方 。 如 果 在 一 个 大 字符 串 中 查找 ， 那 很 幸运 的 ，index 数 可 以 帮 你 的 忙 。 其 看 起 来 如 下 : 











$where = index($big, $smal); 














Perl 查找 子 串 第 一 次 在 大 字符 串 中 出 现 的 地 方 ， 返 回 第 一 个 字符 的 位 置 。 字 符 位 置 是 从 0 开始 编号 的 。 如 果子 串 在 字符 串 
的 开头 处 找到 ， 则 index 返回 0。 如果 一 个 字符 后 ， 则 返回 1 ， 依 次 类 推 。 如 果子 串 不 存在 ， 则 返回 -1 人 。 在 本 例 中 ，$where 
为 6。 





















































急 对 于 早期 的 C 程序 员 会 注意 到 这 类 似 于 C 语言 的 index 函数 。 现 在 的 C 程序 员 可 能 知道 ， 但 从 本 书 观点 来 看 ， 你 应 当 属 于 前 者 。 

















my $stuff = “Howdy world!”; 
my $where = index($stuft “wor); 





另 一 种 方法 是 ， 可 以 将 位 置 数 (position number) 想象 成 找到 此 子 串 所 经 过 的 字符 。 由 于 $where 为 6， 则 在 $stuff 中 找到 wor 
前 经 过 了 6 个 字符 。 





























index 函数 总 是 报告 子 串 出 现 的 第 一 个 位 置 。 可 以 使 用 可 选 的 第 三 个 参数 要 求 它 从 后 面 的 某 个 地 方 开 始 查 询 , 它 会 告诉 index 
从 什么 位 置 开 始 : 




















my $stuff = “Howdy world!”; 


my $wherel = index($stuff“w7); #$wherel 得 到 2 
my $where2 = index($stufft“w” $where+1l); #where 得 到 6 
my $where3 = index($stuff“w”$where+1l); 存 where 为 -1( 没 有 找到 ) 














(通常 不 能 重复 的 查找 菜 个 子 串 ， 除 非 使 用 了 循环 。) 第 三 个 参数 给 出 了 返回 值 的 极 小 值 ， 如 果 自 那个 位 置 及 之 后 的 地 方 不 
能 找到 子 串 ， 则 返回 -1。 




















有 时 ， 你 可 能 想 知 道 某 个 子 串 最 后 出 现 的 位 置 争 。 可 以 使 用 rindex 函数 来 做 到 。 在 下 例 中 ， 我 么 查询 最 后 一 个 斜 线 ， 它 出 
现在 字符 串 的 位 置 4; 





























逃 


急 它 不 是 最 后 找到 的 地 方 。Perl 从 字符 串 另 一 端 开 始 查 找 ， 它 返回 第 一 次 找到 的 位 
的 是 一 致 的 ， 也 是 从 0 开始 编号 。 








， 不 过 它们 是 相同 的 结果 。 其 返回 值 和 我 们 前 面 讨论 
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my $last_slash = rindex(%wetc/passwd”, “7); ## 值 为 4 











rindex 函数 也 有 可 选 的 第 三 个 参数 ， 此 时 ， 它 给 出 的 是 可 能 的 最 大 值 : 

















my $fred =“Yabba dabba dooP; 

my $wherel = rindex($fred,，“abba”); #wherel 得 到 7 
Imy $where2 = rindex($fred, “abba”, $where - D); 寿 where2 得 到 1 
my $where3 =rindex($fred “abba” $where2-1D); 间 whrere3 得 到 -1 


13. 2 使 用 substr 操作 子 串 


substr 只 处 理 部 分 的 字符 串 。 看 起 来 如 下 : 
$part = Substr($string, $initial_position, $length); 


它 有 三 个 参数 : 一 个 字符 串 ， 一 个 从 0 开始 编号 的 初始 位 置 〈 类 似 于 index 的 返回 值 )， 以 及 子 串 的 长 度 。 返 回 值 是 一 个 子 
串 : 





my $mineral = Substr('Fred J Flintstone” 8, 5); # 得 到 “Flint”， 
Imy $rock = substr“Fred J. Flintstone”, 13, 1000; 。”# 得 到 “stone” 








在 上 例 中 ， 如 果 请 求 的 长 度 〈 例 子 中 为 ，1000) 超过 了 学 符 串 的 长 度 ，Perl 不 会 有 任何 抱怨 信息 ， 但 得 到 的 是 一 个 比 你 所 
希望 的 更 短 的 结果 。 如 果 想 明确 要 求 到 达 字 符 串 的 结尾 处 ， 无 论 其 或 长 或 得， 可 以 像 下 例 那 样 省 略 掉 第 三 个 参数 〈 参 数 ): 


























my $pebble = substr “FredJ. Flintsone” 13; # 得 到 “stone” 








初始 位 置 可 以 是 负 的 ， 表 示 从 字符 种 结尾 处 开始 〈 此 时 ，-1 表示 最 后 一 个 字符 ) 多 。 在 下 例 中 ， 位 置 -3 表示 倒数 第 三 个 字 
符 的 位 置 ， 也 就 是 字符 i 的 位 置 ， 




















急 这 和 在 第 三 章 中 见 到 的 数组 索引 是 类 似 的 。 正 如 数组 可 以 从 0 《第 一 个 元 素 ) 开始 ， 也 可 以 从 -1〈 最 后 一 个 元 素 ) 开始 。 子 串 的 位 置 也 
可 以 从 0 开始 《第 一 个 元 素 ) 或 者 从 -1〈 最 后 一 个 元 素 ) 开始 。 


























my $out = Substr (some very long string” -3, 2); #$out 得 到 “in” 
index 和 substr 可 以 很 好 的 一 起 工作 。 在 本 例 中 ， 我 们 提取 出 了 字符 串 中 字母 1 后 的 子 串 。 


my$ $long =“Some very very long String 六 
Imy $right = Substr($long, index($long，]”)); 




















现在 我 们 要 介绍 一 些 非常 酷 的 东西 : 字符 串 中 选择 的 相应 位 置 是 可 以 改变 的 ， 如 果 字 符 串 为 变量 争 : 









































争 是 的 ,技术 上 而 言 ， 它 可 以 是 任何 的 左 值 (value)。 这 个 术语 严格 意义 的 介绍 超出 了 本 书 的 范围 ， 但 你 可 以 将 它 想象 成 在 标量 赋值 中 任何 
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可 以 在 赋值 号 (=) 左 边 出 现 的 。 这 通常 是 一 个 变量 ， 但 也 可 以 《你 马上 将 看 到 ) 是 substr 调用 。 





Imy $string = “Hello, world”; 
substr($string, 0, $) = “Goodbye”; “#$string 现在 变 成 了 “Goodbye, world!” 





























赋值 的 《 子 ) 串 长 度 不 需要 和 它 替 换 的 子 串 长 度 相 同 。 字 符 串 会 自动 调整 到 合适 的 长 度 。 如 果 这 还 不 能 能 给 你 留 下 印象 ， 
你 还 可 以 使 用 绑 定 操作 符 (=~) 来 将 此 运算 限制 在 字符 串 的 某 一 个 部 分 。 下 例 将 字符 串 的 最 后 20 个 字符 串 中 的 fred 蔡 换 成 


barney。 











Substr($string, -20) =~ s/fred/barney/g; 

















在 我 们 自己 的 代码 中 ， 从 没有 用 到 过 上 述 功能 ， 因 此 你 也 很 可 能 用 不 上 。 但 知道 Perl 能 完成 比 你 需要 完成 的 更 多 的 工作 ， 
是 一 件 很 开心 的 事 ， 不 是 吗 ? 


















































substr 和 index 能 完成 的 大 部 分 工作 都 可 由 正则 表达 式 来 完成 。 在 更 适合 使 用 它们 的 地 方 就 使 用 它们 。substr 和 index 通常 
更 快 ， 因 为 没有 使 用 正则 表达 式 : 它们 从 不 是 大 小 写 无 关 的 ， 他 们 没有 元 字符 (metacharacters) 需 要 担心 ， 也 不 设置 内 存 变 


量 (memory variables)。 


























站 


数 是 替 


除了 给 substr 赋值 外 《第 一 次 看 起 来 有 些 怪异 )， 也 可 以 用 更 传统 的 方法 @ 来 使 用 susbtr; 使 用 4 个 参数 ， 第 四 个 
换 的 字符 串 : 


















































镶 按 照 惯 例 ， 我 们 的 意思 是 “函数 调用 ”的 观点 ， 而 不 是 “Perl ”的 观点 ， 因 为 这 个 功能 在 Perl 的 早期 就 有 了 。 











my $previous_value = Substr($string, 0, S，“Goodbye”); 





我 们 也 得 到 了 相同 的 结果 ， 当 然 这 个 函数 也 可 在 void context 中 使 用 ， 将 结果 丢弃 。 





13. 3 使 用 sprintf 格式 化 数据 


sprintf 函数 的 参数 和 printf 的 参数 完全 相同 《除了 可 选 的 文件 句柄 外 )， 但 它 返 回 的 是 被 请 求 的 字符 串 ， 而 非 打印 出 来 。 这 
对 于 希望 将 茶 个 格式 的 字符 串 存 入 变量 以 供 将 来 使 用 的 情况 非常 方便 ， 或 者 你 想 比 printf 提供 的 方法 ， 更 能 控制 结果 : 
























































Imy $data_tag = Sprint 
“9%04d/9602dq/%02d %02d:9%502d:%02d”， 
$yr $mo, $da, $h, $m, $s; 








在 上 例 中 ，$date_tag 得 到 像 “2038/01/19 3:00:08" 这 样 的 值 。 格 式 字 符 串 〈sprintf 的 第 一 个 参数 ) 在 某 些 格式 化 数字 前 使 用 
了 前 置 0， 我 们 在 第 五 章 中 讨论 printf 格式 时 没有 提 到 。 格 式 化 数字 中 的 前 置 0 的 含义 是 ， 如 果 需 要 ， 在 前 面 加 上 0， 使 之 
达到 需要 的 宽度 。 格式 中 如 果 没 有 前 置 0, 则 日 期 一 时 间 的 结果 字符 串 中 , 我 们 得 到 不 需要 的 空格 ,而 非 0, 看 起 来 像 *2038/ 
1/19 3: 0: 8”。 
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13. 3. 1 在 “货币 数字 ”中 使 用 sprintf 











一 种 常用 sprintf 的 地 方 是 ， 你 需要 给 定数 字 的 小 数 点 后 面 几 位 ， 例 如 需要 将 某 个 金钱 数量 显示 为 2.50 而 非 2.5 也 不 是 
2.499971! 这 使 用 “%.2fP” 很 容易 做 到 ; 

















Imy $money = Sprintf "90.2f ,2.49997; 

















铭 弃 的 部 分 是 微不足道 的 ， 但 在 许多 情况 下 ， 需 要 将 所 有 有 效 的 精度 均 保 存在 数字 中 ， 只 是 在 输出 时 再 进行 四 售 五 入 。 
如 果 “ 人 金钱 数 ” 太 大 ， 以 至 于 需要 逗号 () 分 隔 开 ， 你 会 发 现 使 用 像 下 面 这 样 的 子 程序 将 带 来 方便 命 。 







































































争 是 的 ， 我 们 知道 并 非 全 世界 的 任何 地 方 都 使 用 逗号 来 将 数字 分 隔 开 。 也 并 非 任何 地 方 均 是 3 个 数字 一 组 ， 使 用 
但 无 论 怎 样 ， 这 里 是 一 个 好 例子 ! 





司 美国 一 样 的 货币 





慌 


吕 ! 
3 











3 























Sub big_money { 
my $number = Sprintf “9%.2fP, shift @_; 
# 在 do-nothing 循环 中 ， 每 一 次 加 入 一 个 有 速 号 
1 while $number =~ SA(-?d+) (ddd)/$1,$2/; 
# 尾 美元 符号 放 入 合适 的 位 置 
$number =~ S/A(-?)/$1\/; 
$number; 


) 























这 个 子 程序 中 使 用 了 一 些 新 技术 ， 我 们 将 在 下 面 解释 。 子 程序 第 一 行将 第 一 个 〈 唯 一 的 ) 参数 进行 格式 化 ， 使 之 小 数 点 后 
有 其 只 有 两 位 。 因 此 ， 如 果 参 数 中 的 数字 为 12345678.9， 则 $number 为 “12345678.90”。 








下 一 行 中 使 用 了 while 语句 。 正 如 我 们 在 第 十 童 中 捷 介 绍 的 ， 上 述 代 码 可 以 按照 传统 的 while 循环 重 写 : 








while ($number =~ SA(-?\d+) Cdddy/$1, S27) { 
起 
} 
上 上 述 代码 完成 了 什么 工作 呢 ? 上 只 要 替换 部 分 返回 true〈 表 明成 功 )， 则 循环 就 会 持续 下 去 。 但 循环 部 分 什么 也 没 做 。 这 对 于 


Pel 来 讲 是 正确 的 ， 但 这 告诉 我 们 这 段 语句 的 目的 是 执行 条 件 判 断 部 分 《替换 操作 )， 而 非 循环 体 本 身 。 值 1 是 这 种 用 法 中 
的 一 般 方法 ， 也 可 以 使 用 任何 别 的 值 ， 它 们 是 等 价 的 争 。 下 面 的 例子 和 上 面 的 结果 一 样 : 


















































镶 换 句 话说 ， 这 是 没有 用 的 。 顺 便 提 一 句 ，Perl 会 优化 这 个 常 值 表达 式 ， 使 之 不 占用 任何 运行 时 间 。 








keep looping' while $number =~ SA(C?Ad+) CdqNd\dy/$1.$2/; 

















现在 知道 了 替换 部 分 是 上 述 循环 的 真正 目的 ， 但 上 述 替 换 操 作 完成 什么 工作 呢 ? $number 此 刻 是 像 *12345678.90” 这 样 的 数 
字 。 模 式 会 匹配 字符 串 的 第 一 部 分 ， 但 不 能 跳 过 小 数 点 。( 知 道 为 什么 不 行 吗 ? ) 变 量 $1 将 得 到 “12345”,$2 得 到 “678”， 现 
在 $number 变 成 了 “12345,678.90”( 记 住 ， 它 不 能 匹配 小 数 点 ， 因 此 最 后 一 部 分 没有 改动 。) 
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知道 模式 开头 处 的 破 折 号 〈 负 号 : -。 黄 语 中 破 折 号 和 负 号 相同 。 译 者 注 ) 的 含义 吗 ? 《提示 : 这 个 破 折 号 只 人 允许 在 字符 串 
的 一 个 地 方 出 现 。》 我 们 将 在 本 节 结尾 处 指出 ， 如 果 你 还 不 清楚 的 话 。 
































上 述 蔡 换 语 名 还 没 结束 : 由 于 蔡 换 成 功 ， 这 个 do-nothing 又 继续 循环 。 最 后 ,模式 不 能 再 匹配 逗号 前 面 的 字符 串 了 , $number 
变 成 了 “12,345,678.90”。 替 换 部 分 每 循环 一 次 就 加 入 一 个 逐 号 到 数字 中 。 









































对 于 循环 部 分 ， 它 还 没 结束 。 由 于 上 一 次 蔡 换 时 成 功 的 ， 我 们 将 执行 循环 ， 然 后 再 进行 条 件 判 断 。 但 此 时 ， 模 式 不 能 匹配 
上 了 ， 因 为 它 至 少 要 匹配 上 4 个 数字 ， 因 此 循环 结束 。 











我 们 为 什么 不 能 使 用 /g 修饰 符 来 进行 一 个 “全 面 的 ?查找 -替换 ， 以 防止 使 用 容易 混 请 的 1 while 循环 呢 ? 我 们 不 能 用 它 ， 因 
为 我 们 是 从 小 数 点 开始 《向 前 )， 而 非 从 字符 串 开 始 。 如 此 将 有 逗号 加 入 数字 ， 是 不 能 仅仅 使 用 sWg 替换 的 争 。 你 知道 破 折 
号 的 含义 了 吗 ? 它 允 许字 符 串 前 面 有 负 号 。 下 一 名 代码 也 是 这 个 原因 ， 将 美元 符号 加 入 恰当 的 位 置 ， 如 '$$12,345,678.90” 
或 者 在 负数 时 “$12,345,678.90" 。 美 元 符号 可 能 不 是 字符 串 的 第 一 个 字符 ， 和 否则 这 行 代码 要 简单 许多 。 最 后 ， 最 后 一 行 返回 
的 格式 化 后 的 货币 数字 ， 可 以 将 它 输出 在 年 度 报表 中 。 








































































































争 至 少 ， 除 非 使 用 我 们 没有 告诉 你 的 一 些 高 级 的 正则 表达 式 技术 ， 否 则 是 不 能 完成 它 的 。 这 些 Perl 的 开发 者 ， 越 来 越 使 Perl 书籍 的 作者 难 
于 使 用 “不 能 ”这 个 字眼 了 。 





























13. 4 高 级 排序 


在 第 三 章 中 ， 我 们 向 你 演示 了 如 何 使 用 内 骨 的 sort 函数 将 列表 按 ASCII 的 升序 排序 。 如 果 需 要 数字 排序 ， 或 大 小 写 无 关 的 


排序 呢 ? 也 许 你 想 将 存放 在 hash 中 的 元 素 排序 。 是 的 ，Perl 允许 你 按 你 想 要 的 方式 将 列表 排序 ， 在 本 章 结束 前 你 会 看 到 所 
有 这 方面 的 例子 。 






































你 告诉 Perl 你 要 的 顺序 ， 通 过 排序 定义 〈sortrdejzitiom) 的 子 程序 。 当 上 听 到 术语 “sort subroutine( 排 序 子 程序 )” 如 果 你 上 
过 任何 计算 机 课程 的 话 ， 可 能 冒 泡 排序 ， 人 快速 排序 立刻 呈现 在 你 的 脑海 之 中 ， 然 后 说 :“ 不 ， 不 要 再 来 了 !”。 不 要 担心 ， 不 
会 那么 坏 。 事 实 上 ， 很 简单 。Perl 知道 如 何 将 元 素 排序 ， 但 它 不 知道 你 想 要 什么 样 的 排序 。 因 此 排序 子 程序 告诉 它 你 要 的 
顺序 。 

























































































为 什么 要 这 人 么 做 呢 ? 如 果 你 想象 一 下 ， 排 序 是 将 一 些 东 西 通过 比较 按 顺 序 排列 。 由 于 一 次 不 能 将 所 有 的 元 素 进行 比较 ， 你 
需要 一 次 比较 两 个 元 素 ， 最 终 通 过 这 两 个 元 素 的 比较 结果 ， 来 得 到 最 终 的 结果 。Perl 了 解 这 一 切 ， 除 了 不 知道 你 想 怎 样 比 
较 这 两 个 元 素 ， 那 就 是 需要 你 写 的 。 
















































































这 意味 着 排序 子 程序 不 需要 对 大 量 的 元 素 进行 排序 。 事 实 上 只 需要 比较 两 个 元 素 。 如 果 能 将 两 个 元 素 按 恰当 的 顺序 排序 ， 
Pezl 则 能 够 知道 〈 重 复 的 访问 排序 子 程序 ) 你 想 如 何 排序 这 些 数 据 。 




















排序 子 程序 被 定义 成 普通 的 子 程序 一 样 ( 恩 ， 是 的 ， 儿 乎 一 样 )。 这 个 子 程序 会 被 重复 的 调用 ， 次 检查 一 对 你 需要 排序 
的 列表 元 素 。 
































现在 ， 如 果 你 写 一 个 程序 ， 期 望 得 到 需要 排序 的 两 个 参数 ， 你 可 能 写 出 如 下 的 : 





sub any_Sort_sub { # 这 种 方法 不 能 工作 
my($a, $b)=@_; # 得 到 并 对 这 两 个 参数 命令 
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# 开 始 比较 $a 和 $b 


) 
















































































但 排序 子 程序 会 被 重复 调用 ， 通 常 是 上 百 次 或 上 千 次 。 在 顶端 声明 变量 $a 和 变量 $b， 再 给 它们 赋值 只 需要 很 少 的 时 间 ， 但 
将 这 个 时 间 乘 以 其 被 调用 的 次 数 ， 上 百 次 ， 则 它 对 程序 的 运行 时 间 有 显著 的 影响 。 


























我 们 不 希望 这 样 。( 事 实 上 ， 如 果 这 样 做 ， 并 不 能 得 到 正确 结果 。) 事实 上 ， 看 起 来 在 我 们 的 子 程序 运行 前 ， 好 像 Perl 为 我 
们 作 了 这 项 工作 。 你 的 排序 子 程序 不 需要 第 一 行 ，$a 和 $b 会 自动 被 赋值 。 当 排序 子 程序 开始 运行 时 ，$a 和 $b 会 得 到 原始 
列表 中 的 两 个 元 素 。 


















































WE 





排序 子 程序 返回 一 个 值 ， 表 明 这 两 个 元 素 如 何 比较 的 〈 如 C 的 qsort(3) 的 ， 但 为 Perl 自己 的 内 部 实现 方式 )。 如 果 在 最 终结 
果 中 $a 出 现在 $b 之 前 ， 则 其 排序 子 程序 返回 -1。 如 果 $b 出 现在 $a 之 前 ， 则 返回 1。 

















如 果 $a 和 3$b 的 顺序 无 关 紧要 ， 则 子 程序 返回 0。 为 什么 它 无 关 紧 要 呢 ? 也 许 你 正在 做 一 个 大 小 写 无 关 的 排序 ， 而 这 两 个 字 
符 串 是 fed 和 Fted 。 也 许 你 正在 做 一 个 数字 排序 ， 而 这 两 个 元 素 相等 。 








卫 











我 们 可 以 写 一 个 关于 数字 的 排序 子 程序 ， 如 下 : 





Sub by_number { 
这 $a < $b){-1j elsif($a > $b){1} else {0} 
} 











要 使 用 一 个 排序 子 程序 ， 将 它 “〈 不 使 用 &) 放 在 关键 字 sort 和 你 要 排序 的 列表 之 间 。 这 个 例子 将 一 列 数字 按照 数字 顺序 将 
其 排序 ， 并 将 结果 放 入 @result 中 : 











my Q@result = Sort by_number @some_numbers; 





我 们 调用 子 程序 by_number， 因 为 它 描述 了 如 何 排序 。 但 更 重要 的 是 ， 你 可 以 这 样 阅读 上 述 代 码 “sort by number( 按 照 数字 
顺序 排序 )” 和 在 英语 中 一 样 。 许 多 的 排序 子 程序 的 名 字 都 由 by_ 开 头 , 来 描述 如 何 排序 。 基 于 同样 的 理由 ， 我 们 可 以 将 这 
个 子 程序 叫做 numerically， 但 这 需要 输入 更 多 的 字符 ， 且 更 可 能 输 错 一 些 字 符 。 






























































我 们 不 需要 在 排序 子 程序 中 申明 $a 和 $b， 以 及 给 它们 设置 。 如 果 做 了 ， 子 程序 将 不 能 得 到 正确 结果 。 我 们 让 Penl 为 我 们 给 
$a 和 $b 赋值 ， 我 们 只 需要 写 如 何 比较 。 



































事实 上 ， 我 们 可 以 使 之 更 简单 ， 效 率 也 更 高 。 因 为 这 种 三 向 的 比较 (three-way comparisom) 使 用 很 频繁 ，Perl 提供 了 一 种 方便 
的 简写 方式 。 针 对 本 例 ， 我 们 使 用 太空 船 (spaceship) 符号 (<=>) 争 。 这 个 操作 符 比 较 两 个 数字 ， 按 照 数 字 将 其 排序 ， 并 
返回 -1, 0, 1。 因 此 ， 我 们 可 以 将 排序 子 程序 ， 写 成 下 面 更 好 的 方式 : 
























































镶 我 们 这 样 叫 它 的 原因 是 ， 因 为 它 很 像 星 球 大 战 (Sar Wars) 中 的 Tie-fighters。 是 的 ， 我 们 觉得 它们 很 像 。 














Sub by_number {$a <=> $b } 











由 于 这 个 太 衬 船 符号 (<=>) 比 较 数字 ， 你 可 能 猜想 有 一 个 对 应 的 针对 字符 串 的 三 向 操作 符 : cmp。 这 两 个 操作 容易 记忆 和 使 
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用 。<=> 操 作 符 有 类 似 的 数字 比较 符 ， 如 >=， 但 它 K=>) 是 三 个 而 非 两 个 字符 长 ， 因 为 它 有 三 个 而 非 两 个 可 能 的 返回 值 。 而 
cmp 操作 符 有 些 类 似 于 字符 串 比 较 操 作 符 如 ge， 但 它 是 三 个 而 非 两 个 字符 长 ， 因 为 它 有 三 个 而 非 两 个 可 能 的 返回 值 争 。 当 
然 ，cmp 的 顺序 和 默认 的 排序 顺序 是 一 样 的 。 你 不 需要 书写 这 些 子 程序 ， 因 为 它们 几乎 都 是 默认 的 排序 顺序 镶 : 






























































急 这 不 是 巧合 。Larry 作 事 总 是 带 有 目的 的 ， 让 Perl 易于 学 习 和 记忆 。 他 是 一 个 语言 学 家 ， 因 此 他 研究 过 人 们 如 何 思考 语言 。 


























急 你 决 不 会 写 这 些 ， 除 非 你 写 一 个 初级 的 Perl 教 本 ， 需 要 将 它 作为 一 个 例子 。 


Sub ASCJIbetically {$a cmp $bj my @string = Sort ASCJIbetically @any_strings; 








也 可 以 使 用 cmp 来 创建 更 复杂 的 排序 ， 如 大 小 写 无 关 的 排序 ; 





Sub case_insenstive { La” cmp“\L$b”} 





这 里 ， 我 们 比较 两 个 字符 串 $a“〈 强 制 转变 成 小 写 ) 和 $b“〈 强 制 转变 成 小 写 )， 给 出 一 个 大 小 写 无 关 的 排序 。 
































我 们 没有 修改 这 些 数据 本 身 ， 我 们 使 用 它们 的 值 。 这 非常 重要 : 出 于 效率 的 考虑 ，$a 和 y$b 不 是 这 些 数据 的 副本 。 它 们 是 这 
些 原始 数据 的 新 的 ， 临 时 别名 ， 因 此 如 果 修 改 了 它们 ， 则 会 破 环 原 始 的 数据 。 不 要 那样 做 ， 这 几乎 不 被 支持 ， 也 不 被 推荐 。 












































也 








当 你 的 排序 子 程序 像 我 们 这 里 的 那样 简单 时 〈 大 多 数 时 候 ， 是 这 样 的)， 你 可 以 通过 使 用 “in line" 子 程序 来 代替 排序 的 名 字 ， 
使 之 更 简单 ， 如 : 




















my @numbers = sort { $a <=> $b } @some_numbers; 





在 当代 的 Penl 程序 中 ， 几 乎 见 不 到 独立 的 排序 子 程序 ， 你 常见 到 的 是 像 我 们 这 里 的 那样 : in line。 


























假设 想 按照 数字 的 降序 方式 排序 ， 这 通过 使 用 reverse 能 很 容易 的 做 到 : 





my @descending = reverse Sort { $a <=> $b } @some_numbers; 











这 里 有 一 个 技巧 。 比 较 操 作 符 《〈<=> 和 cmp) 是 很 “近视 的 ” 它们 不 知道 哪 一 个 操作 数 是 $a， 哪 一 个 是 $b。 它 们 只 知道 哪 
个 值 在 左边 , 哪 一 个 在 右边 。 如 果 $a 和 $b 交换 位 置 ， 比 较 操 作 符 每 一 次 得 到 的 结果 则 是 相反 的 。 这 意味 着 另 一 种 得 到 逆 
序 的 方式 : 





















































my @descending = sort {$b <=> $a }】 @some_nubmers; 





通过 少许 的 练习 ， 你 可 以 容易 的 阅读 这 些 代 码 。 它 是 一 个 降序 比较 《因为 $ 在 $a 之 前 ， 这 表示 降序 )， 它 是 数字 比较 〈 因 
为 它 使 用 的 是 <=> 而 非 cmp)。 因 此 ， 这 是 一 个 按 相 反方 向 的 数字 排序 。 在 当代 的 Perl 版 本 中 ， 使 用 哪 一 种 方法 无 关 紧 要 ， 
因为 reverse 被 当 作 sort 的 一 个 修饰 符 ， 特 殊 的 简写 方式 阻止 你 使 用 一 种 方式 排序 但 得 到 的 却 是 妃 一 种 结果 。 
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13. 4. 1 依据 值 对 Hash 进行 排序 





一 旦 对 列表 进行 了 排序 ， 你 就 进入 了 一 种 境地 : 想 根据 value 对 hash 排序 。 例 如 ， 我 们 中 的 三 人 昨 晚 去 打 保 龄 球 ， 在 下 列 
的 Hash 中 有 他 们 的 保龄球 成 绩 。 你 想 按照 合 适 的 顺序 将 它们 打印 出 来 , 游戏 的 胜利 者 在 顶端 , 因此 我 们 想 根据 成 绩 (score ) 
对 hash 进行 排序 : 








Imy %gscore = (barney”=>，fred”=>203，dino”=> 30); 


my @winners = SoOrt by_Score keys %Score; 





实际 上 并 不 能 根据 score 对 hash 进行 排序 ， 这 只 是 文字 上 的 简写 。 你 不 能 对 hash 排序 。 我 们 在 前 面 的 hashes 中 使 用 sort 
时 ， 只 是 对 hash 的 keys 排序 〈 按 照 字 母 表 顺序 (ASCIIbetical) 排 序 )。 现 在 我 们 将 对 hash 的 keys 排序 ， 其 顺序 由 其 对 应 的 
hash 中 的 值 决定 。 此 时 ， 结 果 是 根据 保龄球 的 成 绩 这 三 人 的 名 字 的 有 序列 表 ，, 。 
























































写 出 这 个 排序 子 程序 是 非常 容易 的 。 我 们 需要 的 是 针对 score 而 不 是 名 字 ， 使 用 数字 比较 。 不 是 比较 $ 和 $b( 选 手 的 名 字 )， 
我 们 想 比 较 $score($a) 和 $score($b) 〈 它 们 的 成 绩 )。 如 果 你 这 样 思考 ， 答 案 则 呼之欲出 ， 如 下 : 








Sub by_socre { $score{$b} <=> $score{$a}} 


让 我 们 仔细 的 分 析 它 ,看 看 它 是 如 何 工 作 的 。 想 象 第 一 次 调用 它 时 ,Penl 给 $a 赋 值 barney, 给 $b 赋值 fred。 比 较 是 $score{”fred”} 
<=> $score{'barney”} ， 它 是 〈 通 过 hash 得 到 ) 205 <=>195。<=> 是 “近视 的 ” 因此 它 发 现 205 在 195 之 前 ， 则 说 :“ 不 ， 
这 不 是 正确 的 顺序 ，$b 应 当 在 $a 之 前 。 这 告诉 Perl fred 应 当 在 barney 之 前 。 





























可 能 下 一 次 调用 子 程序 时 ，$a 是 barney， 而 $b 是 dino 。“ 近 视 的 ”数字 比较 符 看 到 的 是 30<=>195， 因 此 报告 它们 是 正确 的 
顺序 : $a 确实 是 在 $b 之 前 。 因 此 , barney 在 dino 之 前 。 此 刻 , Perl 有 了 足够 的 信息 来 得 到 列表 的 顺序 : fred 是 胜利 者 , barney 
第 二 名 ， 而 dino 第 三 。 









































为 什么 比较 运算 中 $score{f$b} 在 $score{$a} 之 前 ， 而 非 别 的 方式 ? 因为 我 们 想 按 保 龄 球 成 绩 的 降序 排列 ， 从 最 高 成 绩 依次 向 
下 。 你 可 以 《经 过 一 些 训练 ) 一 眼 就 能 读 懂 这 些 代 码 : $score{$b} <=> $score{$aj 的 意思 是 根据 score， 将 它们 按照 数字 逆序 
排序 。 





13. 4. 2 对 多 个 keys 排序 





我 们 瑟 了 昨 晚 第 四 个 选手 也 和 其 他 三 个 参加 了 保龄球 比赛 ， 此 时 hash 看 起 来 如 下 : 


Imy %Score = { 
Daimney ”三 >95， 人 ed ”三 > 205， 
“dino”=>30，“bam-bamnm ”=> 199; 


1 








bam-bamm 和 barney 的 成 绩 相 同 。 哪 一 个 选手 应 当 在 排序 后 的 列表 的 前 面 呢 ? 比较 运算 不 能 给 出 结果 《〈 发 现 两 边 的 成 绩 相 
同 ) 因为 它 比 较 这 两 个 值得 结果 是 0。 











blei@ 163.com 168 / 201 9/21/2006 


Perl 语言 入 门 (第 














也 许 这 无 关 紧 要 ， 但 我 们 需要 有 一 个 严格 定义 的 顺序 。 


块 ， 但 在 这 一 块 中 ， 他 们 是 按 字母 排序 的 。 怎 样 



































my @winners = Sort by_Score_and_name keys %Score; 
Sub by_Sscore_and_name { 


$score{$b} <=> $score{$al} # 按 照 降序 的 成 绩 
OF 
$a cmp $b; # 字 母 顺 序 的 名 字 


} 


这 是 如 何 工 作 的 呢 ? 如 果 <=> 发 现 了 两 个 不 同 的 成 绩 ， 





先 级 的 or 意味 着 后 面 的 表达 式 将 被 忽略 ， 我 们 需要 的 比较 被 返回 。( 记 住 or 返回 最 后 











四 版 ) 


如 果 几 个 选手 有 相同 的 成 绩 ， 
书写 我 们 刚才 所 描述 的 排序 子 程序 呢 ? 同 以 往 一 样 ， 结 果 很 简单 


这 个 比较 就 是 我 们 所 需要 的 。 它 返回 - 











我 们 希望 他 们 在 结果 的 列表 中 出 现在 




















1 或 1， 一 个 true 值 ， 因 此 低 优 
5 值 的 表达 式 。) 如 果 <=> 发 现 








个 被 位 


























两 边 的 结果 一 致 ， 则 得 到 0， 一 个 false 值 ，cmp 操作 派 上 了 用 场 ， 根 据 这 些 key( 字 符 串 ) 返 回 恰当 顺序 的 值 。 因 此 ， 如 果 成 


绩 相 同 ， 则 根据 字母 顺序 排列 。 








我 们 知道 当 使 用 像 这 样 使 用 排序 子 程序 时 by_score_and_name， 
也 即 是 说 ， 同 样 的 数据 ， 今 天 排序 的 结果 和 明天 排序 的 结果 是 一 样 的 。 























恨 好 的 定义 的 ; 





\ 是 被 











我 们 知道 排序 的 顺序 总 

















人 返回 0 的 唯一 的 情况 是 ， 这 两 个 字符 串 相 同 ， 但 〈 
字符 串 的 列表 传 给 sort， 其 结果 可 能 为 0。 但 这 里 我 





























排序 子 程序 并 没有 限制 在 只 有 两 级 。 这 里 有 一 











于 这 些 字 符 旧 
门 传 入 的 是 hash 的 keys 。 

















个 Bedrock 图 书馆 程序 ， 





[ 道 为 什么 吗 ? 答案 在 脚注 中 售 。) 











永远 不 可 能 返回 0。( 你 所 














是 hash 的 keys) 我 们 知道 它们 是 不 同 的 。 如 果 你 将 有 重复 〈 相 等 的 ) 


根据 5 级 的 排序 将 赞助 者 的 ID 号 排序 争 。 这 个 排序 














例子 根据 每 一 个 赞助 者 的 outstanding fines《〈 由 一 个 叫做 &fines 的 子 程序 计算 ， 这 里 没有 )， 他 们 当前 借 出 的 数目 〈%items )， 

















他 们 的 名 字 《〈 首 先 根 据 姓 〈family name)， 

















使 用 5 级 的 排序 并 非 少 见 





急 在 当代 的 Perl 程序 中 ， 




















@patrons_IDSs = Sort { 
fines($b) <=> 信 fines($a) or 
$items{$b} <=> $items{$aj or 
$family_name{$aj cmp $family_name{$al or 
$personal_name{f$aj cmp $family_name{$bl or 
$a <=> $b 

}) Q@patron_IDs; 


13.S 练习 


案 多 


见 附 录 和 A: 


I 这 





， 但 在 以 前 极 少 使 用 。 





再 根据 名 (personal name)， 均 来 自 于 hash )， 最 后 根据 赞助 者 的 ID 号 : 


























各 对 章 的 列 打 印 出 来 。 使 用 下 面 的 数据 进行 检测 : 





1 [10] 写 一 个 程序 ， 





17 000 04 1.50 3.14139 -10 1.3 4 2001 
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长 





2. [15] 写 一 个 程序 ， 将 下 例 hash 数据 根据 姓 〈last name ) 按照 大 小 写 无 关 的 字母 顺序 进行 排序 ， 并 把 结果 打印 出 来 。 
last name 相同 时 ， 再 按照 名 (first name) 排 序 〈 不 用 关心 大 小 写 )。 因 此 ， 第 一 个 输出 的 的 名 字 是 Fred's， 最 后 一 个 是 
Bettys。 具 有 相同 family name 名 字 在 一 起 。 不 要 改变 数据 。 输 出 名 字 的 大 小 写 应 当 和 这 里 的 一 样 。 



































my %last_name = qw{ 
fred flintstone Wilma Flintstone Barney Rubble 
betty rubble Bamm-Bamm Rubble PEBBLES FLINTSONE 
}， 








3 015] 写 一 个 程序 ， 查 找 给 定子 串 在 给 定 字符 串 中 出 现 的 每 一 个 位 置 ， 输 出 子 串 出 现 的 位 置 。 例 如 ， 给 定 字符 串 为 “This is 
atest” 给 定子 串 为 qis" 它 应 当 输 出 2 和 5。 如 果子 串 是 "a*， 它 应 当 输 出 8。 如 果子 串 为 吃 呢 ? 
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第 十 四 章 进程 管理 




















作为 程序 员 的 一 个 好 处 是 ， 可 以 调用 别人 的 代码 ， 而 不 用 自己 编写。 是 时 候 学 习 如 何 管理 你 的 孩子 了 争 ， 由 Perl 直接 调用 
其 它 程序 。 








银 也 就 是 ， 子 程序 。 





同 Perl 中 其 它 地 方 一 样 ， 有 不 止 一 种 处 理 方 法 〈There's More That One Way To Do ID， 存 在 许多 交叉 ， 变 种 等 等 。 如 果 不 
喜欢 第 一 种 方法 ， 那 么 继续 阅读 ， 找 到 一 种 你 喜欢 的 解决 方法 。 











Perl 是 非常 容易 移植 的 。 本 书 大 多 数 地 方 都 不 需要 注释 说 明 这 种 方法 在 Unix 系统 上 运行 ， 另 一 种 在 Windows 上 ， 第 三 种 
在 VMS 上 。 但 是 ， 如 果 你 调用 其 它 的 程序 ， 那 么 Macintosh 上 面 的 程序 则 可 能 和 Cray 上 是 不 同 的 。 本 章 的 例子 基本 上 是 
基于 Unix 的 ， 如 果 你 的 系统 是 non-Unix 系统 ， 有 可 能 存在 差别 。 












































14. 工 系统 函数 


在 Perl 中 调用 子 进程 来 运行 程序 的 最 简单 方法 是 使 用 system 函数 。 例 如 ， 要 调用 Unix 的 date 命令 ， 看 起 来 如 下 : 























System “date ”; 





























子 进程 运行 date 命令 ， 它 继承 了 Pezl 的 标准 输入 ， 标 准 输 出 ， 标 准 错误 。 这 上 段 话 意思 是 date 命令 产生 的 日 期 时 间 字 符 串 被 
放 在 Perl 的 STDOUT 输出 的 地 方 。 


























系统 函数 的 参数 和 通常 在 shell 中 输入 的 是 一 样 的 。 如 果 是 复杂 一 些 的 命令 ， 如 “ks -1 S$HOME”， 我 们 也 只 需 将 它们 放 入 参 
数 中 : 








System "ls -1$HOME ”; 


























我 们 这 里 将 双 引 号 变 成 了 单 引 号 ， 因 为 $HOME 是 一 个 shell 变量 。 和 否则 ，shell 看 不 到 美元 符号 ， 因 为 Perl 会 将 它 用 值 进行 
替换 。 当 然 ， 我 们 也 可 以 这 样 写 : 








System "ls -1]\HOME 




















但 这 样 看 起 来 非常 答 拙 。 























date 命令 只 是 输出 的 ， 假 设 是 个 有 些 饶 舌 的 命令 ， 首 先 询问 你 “你 的 时 区 是 多 少 ?” 银 这 会 输出 在 标准 终端 上 ， 程 序 再 监 
听 标 准 输入 《从 Perl 的 STDIN 继承 )， 等 竺 回应。 你 看 见 这 个 问题 ， 输 入 答案 〈 例 如 “津巴布韦 时 间 ”，date 再 完成 剩 下 
的 操作 。 
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内 ， 没 有 一 种 date 命令 的 实现 是 这 样 的 。 











< 届 





镶 我 们 所 知道 的 范 目 














它 变 成 后 台 运 行 的 进程 争 ; 











当 子 进程 运行 时 ，Perl 会 耐心 地 等 待 其 结束 。 如 果 date 命令 花 去 37 秒 ， 则 Perl 会 暂停 37 秒 。 可 以 使 用 shell 提供 的 工具 将 
人 人、 









































争 我 们 这 里 所 介绍 的 依赖 于 你 的 系统 。Unix shell (/bin/sh ) 允许 你 在 这 类 命令 前 加 上 & 符号， 使 之 变 成 后 台 进 程 。 如 果 你 的 non-Unix 系统 
不 支持 这 种 方法 ， 那 就 不 能 这 样 做 。 























System “long_running_command with parameters 久 ”; 


这 里 是 shell 调用 的 ， 注 意 命 令 行 结尾 处 的 区 ， 它 将 long_running_command 变 成 后 台 运 行 的 。 然 后 shell 立刻 退出 ，Perl 注 
意 到 这 些 再 继续 执行 。 这 种 情况 ，long_running_command 是 Perl 进程 的 孙子 进程 ，Perl 没有 对 它 直 接 的 了 解 。 





















































当 命 令 “ 非 常 简单 ”时 ， 不 会 使 用 shell。 例 如 date 和 ls 命令 ， 请 求 命 令 会 直接 由 Perl 来 调用 ， 如 果 需 要 ， 它 会 查询 PATH 
急 来 查找 命令 。 但 如 果 其 中 有 些 怪异 的 地 方 〈 例 如 shell 的 元 字符 ， 如 美元 符号 人) , 分 号 () , 竖 线 (0) )，Perl 会 调用 标准 的 
Bourne ShellMpizwvgj 银 ) 来 处 理 这 些 复杂 的 内 容 。 此 时 ，shell 是 子 进 程 ， 被 请 求 的 命令 是 孙 进 程 〈 或 者 更 远 的 后 代 )。 例 如 ， 


你 可 以 写 一 个 如 下 的 一 个 shell 脚本 : 
















































































刍 PATH 在 任何 时 候 都 可 以 被 $ENV{'PATH' } 改 变 。 初 始 时 ， 这 是 从 父 进 程 〈《 通 常 是 shell) 继承 的 环境 变量 (environment varible)。 改 变 这 个 
值 会 影响 到 新 的 子 进 程 但 不 能 影响 到 之 前 的 父 进程 。PATH 是 一 些 可 执行 程序 (命令 ) 的 目录 ， 甚 至 是 在 non-Unix 系统 之 中 。 


妆 不 / 














急 或 者 Perl 被 build 时 所 监测 到 的 。 基 本 上 ， 在 类 Unix 系统 中 这 是 /imp 。 


System 'for iin *; do echo ==$i==; cat $i; done”; 


























这 里 ， 我 们 也 是 使 用 的 单 引 号 ， 因 为 需要 美元 符号 对 shell 有 含义 ， 而 对 Perl 没有 。 双 引号 允许 Perl 用 当前 的 值 来 替换 入 
而 不 是 证 shell 用 它 自 己 的 值 来 代 蔡 。 顺 便 说 一 句 ， 这 个 小 的 shell 脚本 会 过 历 当前 目录 下 所 有 的 普通 文件 ， 输 出 每 一 个 文 
件 的 名 字 和 内 容 ， 如 果 不 相 信 ， 你 可 以 尝试 一 下 。 












































14. 1. 1 避免 Shell 





潜 


无 论 其 有 多 么 复 





系统 调用 可 能 不 止 一 个 参数 争 ， 如 果 这 样 ，shell 将 不 会 被 调用 








局 











人 





























急 或 者 有 一 个 参数 是 indirectobject slot， 例 如 system {'fred'} ”bamey'。 它 运行 程序 barney 但 实际 上 欺骗 了 它 而 是 认为 调用 的 是 “fred '。 
看 perlfunc 的 用 户 手册 

















my $tarfile = “something*wicked.tar” 
my @dirs =qw(fred/flintstone <barney&rubble> betty ); 
System “tar “cvf , $tarfile,@dirs; 



































上 例 中 ， 第 一 个 参数 〈 这 里 是 “tar”) 给 出 了 一 个 通常 能 在 PATH 查询 中 找到 的 命令 ， 余 下 的 参数 再 一 个 接 一 个 的 进行 。 其 
至 如 果 参 数 中 有 对 于 shell 有 重要 意义 的 字符 ， 如 $tarfile 中 的 名 字 ，@dirs 中 的 目录 名 ，shell 也 不 会 有 机 会 来 处 理 它 。 因 此 ， 
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tar 命令 将 得 到 这 5 个 参数 ， 和 下 面 的 比较 : 











System tar cvf $tarfile @dirs”; #Oops! 





这 里 我 们 将 一 些 内 容 倾 入 flintstone 命令 ， 并 将 其 作为 后 台 和 运行， 再 打开 betty 作为 输出 。 


























这 看 起 来 让 人 惊慌 ， 特 别 在 这 些 变量 是 由 用 户 输入 的 ， 例 如 从 web 输入 ， 或 别 的 情况 。 因 此 ， 如 果 可 以 将 它 按 照 多 个 参数 
的 system 版 本 一 样 ， 那 你 很 可 能 应 当 使 用 这 种 方法 来 调用 你 的 子 进 程 。( 你 将 不 得 不 失去 shell 为 你 提供 得 一 些 功 能 ， 如 设 
置 IO 重 定向 ， 后 台 进 程 ， 以 及 类 似 的 。 在 自由 调用 时 ， 没 有 这 些 。) 



























































注意 ，system 的 单个 参数 的 调用 ， 几 乎 等 价 于 多 个 参数 的 调用 ， 


System $command_line; 


System /bin/sh”“-c", $command_line; 























但 没有 人 使 用 后 一 种 版 本 ， 除 非 想 在 不 同 的 shell 中 处 理 ， 如 C-shell: 


System /bin/csh”“-fc”, $command_line; 


甚至 上 面 的 也 不 常见 ， 因 为 One True Shell 争 看 起 来 更 方便 ， 特 别 是 对 于 脚本 而 言 。 














争 也 就 是 /Dizwj。 或 者 你 的 Unix 系统 上 最 类 似 于 Bourne shell 的 shell。 如 果 没 有 One True Shell，Per1 会 考虑 调用 别 的 命令 行 解释 器 ， 以 
得 到 最 恰当 的 结果 。 查 看 Perl 移植 的 文档 。 





























系统 调用 的 返回 值 基于 子 命令 (child command) 退 出 的 状态 人 。 在 Unix 系统 中 ， 退 
什么 地 方 出 了 错误 : 




















T 








必 
人 











8 值 0 指 一 切 正 常 ， 非 0 退出 值 通常 表明 





急 它 是 “waif "状态 ， 为 子 程序 的 退出 码 (child exit code) 乘 以 236， 如 果 内 核 出 了 问题 需要 加 上 128， 加 上 信和 号 码 (singal numbenD 如 果 是 它 激 
发 了 中 断 。 但 我 们 几乎 不 会 检查 这 样 的 细节 ， 一 个 tue/flase 值 对 几乎 所 有 的 应 用 已 经 足够 了 。 























unless (System date) { 
# 返 回 0 一 表示 成 功 
Print “We gave a date, OKIn 








这 追溯 于 通常 大 多 数控 作 所 采用 的 “true is good, false is bad” 策 略 ， 因 此 要 按照 典型 的 "do this or die” 风 格 来 写 ， 我 们 要 返 
回 false 或 者 tue。 最 简单 的 方法 是 在 system 操作 前 加 上 一 个 前 绥 的 感叹 号 〈 逻 辑 非 ): 














!System rm =-rf files_to_delete ”or die “Something went wrong ”; 

















这 个 例子 中 ， 在 错误 信息 中 包含 $! 是 不 恰当 的 ， 因 为 失败 很 大 可 能 是 由 于 rm 操作 部 分 的 原因 ， 这 不 是 和 系统 调用 相关 的 错 
误 ， 因 此 Penl 的 $! 变 量 不 能 描述 。 
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14.2exec 函数 




















除了 一 个 地 方 〈 非 常 重要 的 ) 以 外 ， 我 们 前 面 介绍 的 system 的 语法 〈syntax) 及 语义 (semantics) 对 于 exec 函数 也 是 相同 的 。 
system 函数 创建 子 进程 ， 它 会 立刻 去 执行 请 求 的 操作 ，Perl 则 和 暂停 。exec 函数 引起 Perl 自己 处 理 请 求 的 操作 。 可 以 将 它 看 
作 ”“goto” 而 非 子 程序 调用 。 











例如 ， 假 设 我 们 想 在 mrp 目录 下 运行 bedrock 命令 ， 将 -o argsl 以 及 其 它 的 调用 的 参数 传递 给 它 。 看 起 来 如 下 : 








chdir ytmp”or die “Cannot chdir /tmp: $7”; 
eXxec “bedrock” -0o” @ARGYV; 




















当 执 行 到 exec 操作 时 ，Perl 找到 bedrock， 再 “ 跳 到 那里 jumps to iD。” 此 时 ，Perl 进程 离开 争 ， 只 有 运行 bedrock 命令 的 
进程 。 当 bedrock 结束 时 ，Perl 不 会 回来 ， 因 此 我 们 将 得 到 退出 的 提示 (prompt bac)， 如 果 在 命令 好 中 调用 这 个 程序 。 
































争 实 际 上 ， 这 是 同一 个 进程 ， 执 行 Unix 的 exec(2) 系 统 调 用 〈 或 者 等 价 的 )。 进 程 ID 是 同一 个 。 






































为 什么 这 是 有 用 的 昵 ?7 如 果 Perl 程序 的 目的 只 是 设置 一 个 特殊 的 环境 变量 ， 以 运行 另 一 个 程序 ， 则 当 另 一 个 程序 启动 时 ， 
其 目的 就 已 达到 。 如 果 我 们 使 用 system 而 非 exec, 我 们 就 让 一 个 Perl 程序 等 待 另 一 个 程序 的 完成 , 当然 Perl 最 终 能 够 退出 。 
但 这 会 浪费 资源 。 































































































说 了 这 么 多 ， 实 际 使 用 exec 的 情况 很 少 ， 除 了 和 fork 一 起 使 用 外 《〈 这 将 在 后 面 介 绍 )。 如 果 分 不 清 system 和 exec， 那 使 用 
system， 在 大 多 数 情况 下 ， 都 不 会 有 问题 。 




















由 于 当 被 请 求 的 命令 运行 时 ，Perl 不 再 能 控制 ， 因 此 在 exec 命令 后 面 的 任何 代码 均 不 会 有 任何 意义 ， 除 了 处 理 不 能 启动 该 
请 求 的 错误 的 代码 外 : 
































exec “date”; 
die“date couldn't run: $1”; 

















如 果 将 warning 打开 ， 并 且 exec 后 面 除了 die 还 有 别 的 代码 争 ， 你 将 得 到 提示 信息 。 





多 或 者 exit。 或 者 在 块 的 结尾 处 。 这 可 能 在 新 的 Perl 版 本 中 改变 。 








14.， 3 环境 变量 


当 启 动 另 一 个 进程 时 《利用 这 里 讨论 的 任何 技术 )， 你 可 能 需要 将 它们 的 环境 变量 进行 不 同 的 设置 
其 有 某 个 工作 目录 (working directory)， 这 从 你 的 进程 中 继承 。 另 一 个 配置 的 细节 是 环境 变量 。 











。 你 可 以 局 动 一 个 进程 ， 



































其 中 最 著名 的 环境 变量 是 PATH。( 如 果 你 从 没有 昕 过 ,， 那 可 能 你 的 系统 中 没有 环境 变量 。) 在 Unix 或 类 似 的 系统 中 ，PATH 
是 一 个 由 去 号 分 隔 开 的 目录 列表 ， 这 些 列 表 的 元 素 可 能 是 程序 名 。 当 输入 像 mm fred 这 样 的 命令 时 ， 系 统 将 按照 顺序 在 这 些 
目录 列表 中 查找 rm 命令 。Perl( 或 你 的 系统 ) 将 在 任何 需要 查找 程序 的 时 候 使 用 PATH。 如 果 程 序 运 行 其 它 的 程序 ， 也 需要 在 
PATH 中 学 找 。( 如 果 你 是 用 完全 的 名 字 作 为 命令 ， 如 [ivecjhno， 则 没有 必要 碍 找 PATH。 但 这 没有 那么 方便 。) 
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在 Perl 中 ， 环 境 变 量 可 以 通过 %ENV 这 个 hash 变量 得 到 ，hash 中 的 每 一 个 key 代表 一 个 环境 变量 。 当 你 的 程序 开始 执行 
时 ，%ENYV 中 的 值 从 其 父 进程 中 继承 〈 这 通常 是 shell)。 修 改 这 个 hash 将 改变 环境 变量 ， 这 将 被 新 的 进程 继承 ， 也 有 可 能 
被 Perl 继承 。 例 如 ， 假 定 你 想 运 行 系统 的 make 工具 《〈 它 通常 会 运行 别 的 程序 )， 你 想 首 先 在 某 个 私有 目录 中 查找 命令 〈 包 
括 make)。 并 且 让 我 们 假定 你 在 运行 命令 时 不 想 设 置 IFS 这 个 环境 变量 ， 因 为 它 可 能 使 make 或 别 的 子 命令 (subcommand ) 
做 一 些 错误 的 事 。 如 下 : 









































$ENV{PATH } = “home 上 rootbeerbin:$ENV(CPATH 7; 
delete SENV{TIES }; 


Imy $make_result = System “make”; 











新 创建 的 进程 通常 会 从 它们 的 父 进程 中 继承 环境 变量 ， 当 前 的 工作 目录 ， 标 准 输入 ， 输 出 ， 以 及 错误 流 ， 还 有 一 些 深 奥 的 
东西 。 碍 看 你 系统 上 编程 的 书籍 ， 以 了 解 更 详细 的 信息 。( 在 大 多 数 系统 中 ， 不 能 改变 shell 或 者 启动 它 的 父 进 程 的 的 环境 
变量 。) 























14. 4 使 用 反 引 号 捕捉 输出 


对 于 system 和 exec， 其 输出 的 结果 传 到 Perl 标准 输出 的 地 方 。 有 时 ， 将 其 结果 作为 字符 串 保 留 下 来 以 便 进 一 步 处理 是 很 有 
趣 的 。 这 可 以 通过 使 用 反 引 号 (而 非 单 引号 或 者 双 引 号 做 到 : 
































my $now = "date ; # 捕 获 date 的 输出 
print“The time is now $now # 已 经 有 换行 符 

















一 般 ，date 命令 会 输出 大 概 30 个 字符 到 标准 输出 设备 ， 给 出 当前 日 期 ， 时 间 以 及 换行 符 。 当 我 们 把 date 放 在 反 引 号 之 间 ， 
Perl 执行 date 命令 ， 将 其 作为 一 串 字 符 串 值 ， 这 里 赋 给 变量 qnew。 
























































这 同 Unix shell 的 反 引 号 含义 是 类 似 的 。 但 ，shell 做 了 额外 的 工作 ， 将 结尾 的 换行 符 去 掉 了 ， 方 便 在 其 它 地 方 应 用 。Penl 
很 老实 ; 它 给 出 了 实际 的 输出 结果 。 因 此 在 Perl 中 要 得 到 相同 的 结果 ， 需 要 使 用 chomp: 














chomp(my $no_newline_now = "date ); 


print“A moment ago, it was $no_newline_now, Ithink.m” 


























反 引 号 中 的 值 类 似 于 单 引 号 的 system 争 的 效果 ， 其 被 作为 双 引 号 字符 串 解释 ， 也 就 是 其 中 的 转 义 字符 ， 变 量 会 被 处 理 争 。 
例如 ， 要 得 到 一 列 Perl 函数 的 文档 ， 可 以 重复 使 用 perldoc 命令 ， 每 一 次 使 用 不 同 的 参数 : 











售 也 就 是 说 ， 它 总 是 被 One True Shellwbin/sh) 或 类 似 的 处 理 ， 





如 果 system 调用 一 样 。 























争 如 果 想 要 反 斜 线 ， 需 要 使 用 2 个 。 如 果 想 要 两 个 〈 这 在 Windows 系统 中 经 常 出 现 )， 则 需要 四 个 。 














my @functions = dqw { int rand Sleep length hex eof not exit sqrt umask }; 


Imy %about; 


foreach(@functions) { 
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$about{$_} = `perldoc -t-f$ ; 
} 

















忒 


当 每 一 次 调用 时 ，$ _ 的 值 都 不 同 ， 使 我 们 一 次 处 理 一 个 命令 。 如 果 没 见 过 其 中 的 一 些 函 数 ， 查 找 相应 文 要 了 解 其 功能 是 有 
的 。 


忌 | 


反 引 号 没有 简单 的 单 引 号 等 价 形式 争 ; 变量 ， 和 转 义 字符 〈 如 : \n) 是 会 被 处 理 的 。 没 有 简单 的 多 参数 的 system 的 等 价 形 
式 ， 如 果 不 使 用 shell 的 话 。 如 果 反 引号 中 的 命令 过 于 复杂 ，Unix 的 Bourne Shell (或 者 你 的 系统 使 用 的 ) 被 自动 调用 ， 解 








争 有 一 些 更 复杂 的 方法 ， 如 可 以 将 字符 串 放 在 qx…" 之 中 等 。 











我 们 建议 你 在 像 本 例 那样 部 捕捉 输出 合 的 情况 下 避免 使 用 反 引 号 : 














急 这 被 叫做 “void”context。 


Print “Starting the frobnitzigator: \m ; 
`frobnitz -enable `， # 请 不 要 这 要 做 ! 


Print “Doneln ; 














问题 在 于 Perl 会 尽力 去 捕捉 这 个 命令 的 输出 ,虽然 你 是 想 将 其 丢弃 。 并 
因此 从 安全 和 效率 的 观点 ， 应 当 使 用 system。 








上 


且 , 你 也 失去 了 使 用 system 对 多 个 参数 控制 的 机 会 。 




















反 引 号 命令 的 标准 错误 继承 了 Perl 当前 的 标准 错误 输出 。 如 果 命 令 将 错误 信息 传 到 了 标准 错误 (standard errom)， 你 可 能 在 终 
端 见 到 它 ， 这 可 能 让 用 户 迷 惑 ， 因 为 他 没有 调用 frobnitz 命令 。 如 果 想 用 使 用 标准 输出 〈standard output ) 捕捉 错误 信息 ， 
可 以 使 用 shell 的 “将 标准 错误 并 入 当前 的 标准 输出 中 ”， 其 如 通常 在 Unix shell 中 所 作 那 样 2>&1: 


























my $output_with_errors = `frobnitz -enable 2> 作 |; 











这 会 将 标准 错误 输出 并 入 标准 输出 中 ， 和 在 终端 中 所 见 的 基本 类 似 ， 只 是 可 能 由 于 缓冲 ， 其 顺序 不 同 。 如 果 想 输出 和 错误 
输出 分 离 ， 你 会 发 现 一 种 难于 和 输入 ard-to-type) 的 解决 方法 争 。 类 似 的 ， 标 准 输入 也 继承 了 Peal 的 当前 标准 输入 。 在 反 引 
号 中 的 命令 通常 不 会 从 标准 输入 读 ， 因 此 这 几乎 不 是 问题 。 但 ， 让 我 们 以 date 命令 需 输 入 时 区 《我 们 早 些 也 作 了 这 些 假 设 ) 
为 例 。 这 会 引起 问题 ， 因 为 提示 语 “which time zone" 将 被 送 到 标准 输出 上 ， 而 这 会 被 捕获 作为 部 分 的 值 。 然 后 ，date 命令 相 
从 标准 输入 读 入 。 由 于 用 户 没 有 见 到 提示 符 ， 他 不 知道 需要 输入 。 很 快 ， 用 户 就 会 通知 你 ， 告 诉 你 你 的 程序 不 动 了 。 








































































































争 例 如 Pezl 标准 的 库 PC::Open3 。 或 者 你 自己 写 forking， 这 会 在 后 面 介 绍 。 






































因此 ， 不 要 使 用 那些 需要 从 标准 输入 读 入 的 命令 。 如 果 不 太 确定 其 是 否 从 标准 输入 读 入 ， 加 入 从 [evwrxl 的 重 定向 ， 如 : 











my $result = `Some_questionable_command arg arg argh </devnull; 


child shell 的 输入 会 重 定向 到 /devnull，grandchild 的 有 询问 的 命令 〈questionable command) 在 最 坏 的 情况 下 将 从 /devmnull 
读 入 ， 当 然 什 么 也 没有 。 
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中 使 用 反 引 号 












































如 果 命 令 的 输出 有 多 行 ， 在 标量 环境 中 使 用 反 引 号 将 其 作为 单个 字符 串 返 回 ， 其 中 包括 换行 字符 。 但 是 ， 在 列表 context 
中 使 用 相同 的 反 引 号 字符 串 将 得 到 一 个 列表 值 ， 每 一 元 素 含 有 一 行 值 。 























例如 ，Unix 的 who 命令 通常 会 返回 当前 登录 系统 的 每 一 个 用 户 《 一 个 用 户 一 行 )， 如 下 : 











Imerlyn tty/42 Dec7 19.41 
rootbeer _ console Dec2 14.13 
rootbeer tty/12 Dec6 23:00 


左 侧 一 列 是 用 户 名 (username)， 中 间 






































列 是 tty 名 字 《〈 用 户 到 机 器 的 连接 的 名 字 )， 剩 下 的 是 登陆 日 期 和 时 间 《〈 可 能 是 远程 登 








有 孙 的 信息 ， 但 本 例 不 是 )。 在 标量 context 中 ， 我 们 一 次 得 到 所 有 值 ， 我 们 需要 将 其 分 开 : 





my $who_text = “who ; 




















my @who_lines = who ; 


我 们 在 @who_lines 会 得 到 几 个 不 同 








但 在 列表 context 中 ， 我 们 会 自动 得 到 按 行 分 开 的 数据 : 











的 元 素 ; 每 一 个 由 换行 符 结 束 。 在 其 上 使 用 chomp 会 去 掉 换 行 符 。 让 我 们 用 不 同 的 方法 

















来 处 理 。 如 果 我 们 将 其 传递 给 foreach， 会 自动 在 行 之 间 进 行 奉 代 ， 依 次 传递 给 $_: 


foreach (wpho7) { 
my($user, $tty, $date) = /CS+) 


\S+(CS+)NS+(.)/; 


$ttys{$user}.=“$tty at $date\m”; 


} 











它 会 循环 3 次 。( 你 的 系统 可 能 在 任意 时 刻 有 不 止 3 个 登录 用 户 。) 循环 中 的 第 一 个 语句 是 正则 表达 式 匹配 ， 没 有 使 用 邦 定 
操作 符 〈=~)， 它 会 匹配 $_， 这 是 可 以 的 ， 因 为 数据 就 存放 在 其 中 。 












































正则 表达 式 寻 找 非 空白 词 Cnonblank word)， 一 些 空 白 ， 非 空白 词 ， 一 些 空 自 ， 以 及 此 行 剩余 的 部 分 , 但 不 包括 ， 换 行 符 〈 因 
为 点 () 软 认 的 情况 下 不 会 匹配 换行 符 ) 争 。 这 是 可 行 的 ， 因 为 $_ 每 一 次 的 值 的 结构 是 类 似 的 。 其 中 第 一 次 循环 时 ， 匹 配 成 











功 ，$1 为 “merlyn”，$2 为 "tty/427， 


急 现 在 你 知道 为 什么 点 (在 默认 时 不 






























































$3 为 "Dec7 19:41”。 


匹配 换行 符 了 。 它 使 我 们 容易 的 写 出 这 样 的 模式 ， 而 不 用 担心 结尾 处 的 换行 符 。 























但 ， 这 个 正则 表达 式 是 在 list context 中 使 用 的 ， 因 此 我 们 会 得 到 其 列表 值 ， 而 不 是 true/false 值 ， 表 示 其 是 否 匹 配 ， 如 在 第 





八 章 中 介绍 的 。 因 此 ，$user 的 值 为 “merlyn”， 等 等 。 
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值 是 附加 (可 能 是 undef)， 因 为 一 个 用 户 如 上 例 的 “rootbeer 可 能 


工 





循环 中 的 第 二 条 语句 将 tty 和 date 的 信息 存储 到 hash 中 ， 
登陆 不 止 一 次 。 











14. 5$ 像 文件 句柄 那样 处 理 










































































到 目前 为 止 ， 我 们 只 是 介绍 了 处 理 同 步 进程 〈synchronous processes) 的 方法 ， 此 时 仍然 是 Perl 在 控制 ， 调 入 命令 ，( 通 名 ) 
等 待 其 结束 ， 可 能 捕获 其 输出 。 但 Perl 也 可 以 在 调用 子 进 程 时 仍 保持 运行 ， 与 之 交互 争 ， 直 到 完成 任务 为 止 。 





























通过 管道 或 者 任何 你 的 操作 系统 提供 的 进程 间 通 讯 的 方法 。 




















开始 一 个 并 发 〈 并 行 ) 子 进程 的 语法 是 将 命令 作为 “文件 名 ” 传 给 open， 并 在 其 前 面 或 后 面 加 上 竖 线 (|)， 竖 线 是 “管道 
Cpipe)” 符 。 基 于 这 些 原 因 ， 这 通常 叫做 管道 打开 (piped open ): 



































open DAIE， “datel”or die“cannot pipe from date: $” 
open MAIL，“Imail merlyn”or die “cannot pipe to mail: $!”; 











在 第 一 个 例子 中 ， 竖 线 在 右边 ， 命 令 被 调 入 ， 且 其 被 打开 到 DATE 这 个 文件 句柄 进行 读 入 ， 这 和 shell 中 的 命令 
datelyour_program 类 似 。 在 第 二 个 例子 中 ， 出 现在 左边 ， 命 令 的 标准 输入 被 连接 到 MAIL 这 个 文件 句柄 ， 这 和 命令 
your_program 1mail merlyn 类 似 。 在 任意 种 情况 下 ， 命 令 被 调 入 ， 和 Perl 进程 是 独立 的 争 。 如 果子 进程 没有 被 创建 成 功 ,在 
打开 时 将 失败 。 如 果 命 令 不 存在 或 异常 退出 ， 在 打开 时 将 《通常 ) 不 会 被 当 作 错误 ， 但 在 关闭 时 会 。 我 们 将 会 很 快 介绍 到 。 

































































刍 如 果 一 个 Perl 进程 在 命令 完成 之 前 退出 了 ， 一 个 读 入 的 命令 将 得 到 end-of-file， 当 一 个 命令 正在 写 入 时 在 默认 情况 下 下 一 次 写 入 将 得 到 








“broken pipe” 的 错误 信号 (error signal) 














为 了 各 种 目的 和 意图 ， 程 序 剩 余部 分 不 知道 ， 也 不 关心 ， 这 个 句柄 打开 的 是 进程 还 是 文件 。 因 此 ， 要 从 文件 句柄 中 读 入 数 
据 ， 我 们 可 以 使 用 通常 的 方法 : 























my $now = <DATE>; 











要 将 数据 送 给 mail 进程 〈 从 标准 输入 等 待 要 传递 给 merpym 的 消息 )， 一 个 简单 的 打印 文件 句柄 就 可 以 了 : 











print MAIL “The time is now $now”; # 假 定 $now 由 换行 符 结尾 























简 言 之 ， 你 可 以 假装 这 些 文件 句柄 指向 一 些 特殊 的 文件 ， 一 个 含有 date 命令 的 输出 ， 一 个 将 自动 的 使 用 mail 命令 将 其 邮寄 
出 去 。 




















如 果 一 个 进程 连接 到 一 个 文件 句柄 ， 被 打开 来 读 ， 然 后 退出 ， 文 件 句柄 返回 end-of-file， 如 同 读 到 普通 文件 的 结尾 符 。 当 关 
闭 一 个 打开 来 写 入 到 进程 的 文件 句柄 时 ， 进 程 将 发 现 end-of-file， 因 此 ， 结 束 发 送 email， 关 闭 句柄 : 





























close MALL; 


die“mail: nonzero exit of $2” 让 $?; 
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如 果 关 闭 一 个 关于 进程 的 文件 句柄 , Perl 等 待 其 完成 ,以便 得 到 其 进程 的 退出 状态 。 退 出 状态 可 以 通过 变量 $? 得 到 ( 同 Bourne 
Shell 的 变量 一 样 ) 其 数值 同 system 函数 的 返回 值 是 一 致 的 : 0 表示 成 功 ， 非 0 表示 失败 。 每 一 个 新 的 退出 的 进程 会 覆盖 以 
前 的 值 ， 因 此 尽快 保存 它 ， 如 果 需 要 的 话 。G? 变 量 也 含有 最 近 的 system 或 反 引 号 人 ) 调 用 的 退出 状态 ， 如 果 你 好 奇 的 话 。) 






















































































这 些 进 程 是 同步 的 ， 同 管道 命令 一 样 。 如 果 尝 试 读 时 ， 数 据 还 没准 备 好 ， 则 进程 被 悬挂 〈 不 会 消耗 额外 的 CPU 时 间 ) 直到 
数据 准备 好 为 止 。 同 样 的 ， 如 果 一 个 写 进 程 在 读 进 程 之 前 ， 写 进程 将 慢 下 来 ， 直到 读 进 程 跟 上 来 。 这 里 有 一 个 缓冲 〈buffer) 
〈 通 常 是 SKB )， 因 此 它们 不 需要 完全 一 致 。 









































为 什么 将 进程 作为 文件 句柄 来 使 用 呢 ? 这 是 将 结果 写 入 进程 的 唯一 简单 方法 。 如 果 只 是 读 ， 反 引号 调用 可 以 方便 的 处 理 ， 
除非 需要 将 其 结果 作为 输入 传 给 别 的 进程 。 




















例如 ，Unix 的 find 命令 根据 文件 的 属性 来 定位 文件 ， 如 果 在 大 量 的 文件 中 查找 ， 它 会 花 一 些 时 间 。( 例 如 ， 从 根 目录 开始 
查找 )。 你 可 以 将 find 命令 放 在 反 引 号 之 间 ， 当 找到 就 显示 将 更 好 : 





open FE find / -atime +90 -Size +1000 -printP” or die “fork: $!” 
while(<F>) { 
chomp; 
printf 9%s Size %dK last accesSsed on %SAm ， 
$_, (1023 + -S$_)/1024, -A$_; 
} 














这 个 例子 中 的 find 命令 查找 所 有 在 最 近 90 天 没有 访问 ， 且 大 于 1000 块 的 文件 。( 和 它们 是 被 备份 的 好 对 象 ) 当 find 查询 时 ， 
Peal 等 待 。 每 当 找到 时 ，Perl 会 将 其 名 字 ， 以 及 一 些 其 它 信息 显示 出 来 以 供 进一步 的 分 析 。 如 果 用 反 引 号 来 做 ， 我 们 在 find 
命令 执行 完 之 前 是 得 不 到 任何 输出 的 。 通 常 在 没有 结束 前 就 看 见 它 在 工作 是 很 舒服 的 。 






































14. 6 使 用 fork 





除了 介绍 的 high-level 接口 外 ，Perl 还 提供 了 直接 访问 low-level 进程 管理 系统 的 方法 。 如 果 以 前 没有 做 过 争 ， 你 很 可 能 想 
路 过 此 节 。 事 实 上 将 本 节 写 成 一 章 更 恰当 ， 但 让 我 们 快速 的 介绍 这 些 : 















































旬 或 者 你 的 系统 不 支持 forking。 但 Perl 的 开发 者 努力 工作 ， 甚 至 将 forking 移植 到 那些 底层 的 进程 模型 和 Unix 很 不 同 的 系统 之 中 。 





System “date ; 


看 看 如 何 使 用 low-level 系统 调用 的 方式 来 完成 它 : 








defined(my $pid= fork) or die“Cannot fork: $7”; 
unless ($pid){ 
# 子 进程 在 这 里 


eXxec “date”; 





die“cannot exec date: $; 
} 
# 父 进程 在 这 里 
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waitpid($pid, 0) 


这 里 ， 我 们 检查 fork 的 返 
子 进 程 在 执行 exec 函数 。 父 进程 跳 过 这 
咯 )。 如 果 这 些 看 起 来 像 官 样 文章 ， 只 需 记 住 你 仍 可 以 继续 使 有 


非 0， 因 此 只 











如 果 不 怕 厅 烦 ， 


























还 能 完全 控制 任意 的 管道 ， 
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和 























14. 7 发 送 和 接收 信和 号 


Unix 信和 号 是 传送 给 进程 的 小 消息 。 它 不 能 说 明太 多 问题 ， 就 像 汽 车 的 喇叭 声 : 你 听 得 喇叭 声 是 指 “ 注 意 ， 桥 塌 了 ”“ 灯 的 


颜色 变 了 ， 走 风 “ 停 车 ， 有 个 小 孩 在 车 顶 
针对 这 些 不 同 的 情形 争 。 信 和 号 日 
16，1 到 32，1 到 64， 这 要 看 你 的 Unix 的 情况 ) 组 成 。 信 和 号 通常 是 厂 
是 CtrLC)， 这 会 发 送 SIGINT 给 这 个 上 的 所 有 进程 争 。 某 些 信号 会 自动 由 系统 发 送 ， 他 们 是 由 


争 是 的 ， 实 际 上 不 是 这 样 的 情形 ， 这 里 只 是 - 

















新 排列 文件 句柄 (rearranging filehandles) ， 
ID《〈 如 果 可 知 的 话 )。 但 是 ， 这 些 内 容 足 够 写 一 章 了 ， 请 参阅 perlipc 的 用 户 手册 了 解 更 详细 的 信息 《以 及 关于 你 系统 的 应 
用 程序 编程 的 优秀 书籍 )。 



































日 名 字 〈 如 SIGINT 意思 是 “interrupt singal( 











E 某 个 事 们 





























-个 比喻 。 对 于 这 些 ， 








争 你 认为 按 下 Ctrl-C 停止 程序 。 事 实 上 , 它 只 是 发 送 SIGINT 信和 号 , 默认 情况 这 会 停止 程序 。 在 本 章 后 录 











\ 记 


二 




















肯 system 函数 ， 而 不 月 





口 


加 值 ， 失 败 时 为 undef。 通 常会 成 功 ， 因 此 在 下 一 行 时 有 两 个 独立 的 进 各 


FEy， 











但 只 有 父 进程 的 $pid 
部 分 执行 waitpid 函数 ， 等 待 那个 子 进 程 结 束 〈 如 果 期 间 其 它 的 进程 
晶 担 心 会 被 你 的 朋友 笑话 。 














知 你 的 进程 ID 和 你 的 父 进程 的 














上 ” 或 “ 咀 ， 你 好 ”? 事 运 的 是 ，Unix 信号 比 它 容易 理解 ， 因 
P 断 信号 )”” 和 对 应 的 一 个 小 整数 〈 范 围 1 到 
发 生 时 发 送 的， 如 在 终端 按 下 中 断 键 〈 通 常 
另 一 个 进程 发 送 的 。 




















时 它 能 做 些 不 同 的 事 ， 而 非 立刻 停止 程序 。 


你 可 以 从 你 的 Perl 进程 发 送信 号 到 其 它 的 进程 ， 





道 了 其 ID 为 4021， 












































现在 想 发 送 SIGINT 给 它 。 这 非常 简单 : 














多 通常 ， 你 知道 大 





是 为 什么 许多 运行 时 间 长 久 的 程序 将 它们 自己 的 进程 ID 














进程 ID， 因 为 它 是 你 通过 fork 创建 的 子 进程 ， 或 者 从 文 们 











但 你 需要 知道 目标 进程 




















的 ID。 怎 





























Kill 2, 4201 or die“Cannot Signal 4201 with SIGINT: $”; 

















为 有 不 同 的 信号 




















信和 号 是 SIGHUP SIGCONT'SIGINT 和 SIGZERO( 信 和 号 0). 


, 你 可 以 写 个 程序 , 当 接 收 到 SIGINT 


或 者 别 的 程序 知道 。 使 用 别 的 程序 可 能 困难 和 易 犯 错误 ， 
有 存在 文件 中 ， 通 常会 在 程序 的 文档 中 说 明 这 些 。 





么 得 到 它 有 些 复杂 争 ， 我 们 假设 你 已 经 知 


其 名 字 古 "kill" 因 为 信号 的 一 个 主要 目的 就 是 停止 长 时 间 运 行 的 程序 。 你 可 以 使 用 字符 串 TNT' 蔡 换 2， 因 为 信号 码 〈singal 





number) 2 是 指 SIGINT。 如 果 进 程 不 存在 争 ， 你 会 得 到 一 个 错误 的 返 加 
























































值 ， 可 以 使 用 这 种 技术 验证 一 个 进程 是 否 活 着 。 特 





殊 的 信号 码 0 的 含义 是 :“ 检 查 是 否 可 以 发 送信 号 ， 但 我 实际 不 想 ， 所 以 什么 也 不 发 送 。” 这 种 进程 探测 的 程序 看 起 来 如 下 : 


争 如 有 果 不 是 超级 用 








户 ， 进 程 又 是 其 他 人 的 ， 你 发 送信 号 也 会 失败 。 毕 竟 ， 


while (kill 0, $pid) { 


warn“$pid has gone away 己 ; 











将 SIGINT 发 送 给 其 











已 用 











户 的 程序 是 非常 不 礼 狐 的 。 














比 发 送信 号 更 有 趣 的 可 能 是 捕捉 信号 。 为 什么 想 要 这 么 做 呢 ? 假设 你 有 一 个 程序 在 rp 下 建立 了 一 些 文件 ， 通 第 ， 在 程序 
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结束 时 ， 你 需要 删除 这 些 文件 。 如 果 在 程序 运行 期 间 ， 某 人 按 下 Ctrl-C， 则 在 [razp 留 下 了 一 些 垃圾 文件 ， 这 是 不 好 的 。 要 
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E 这 个 问题 ， 你 可 以 创建 一 个 singal handler 来 处 理 清 除 的 问题 : 





莹 
| 











my $temp_directory = “/tmp/myprog.$$”# 在 这 里 创建 文件 
mkdir $temp_directory, 0700 or die “Cannot create $temp_directory: $7”; 





Sub clean_uUp{ 
unlink glob“$temp_directory/:”; 
Imdir $temp_directory; 


} 


Sub my_int_handler { 
儿 clean_up; 


die “Interrrupted, exiting .. .DO”; 


$SIG{intf”}) = my_int_handler'; 


# 程 序 运 行 一 段 时 间 后 ， 在 temp 目录 下 创建 了 一 些 临时 文件 ， 可 能 某 人 按 下 了 CtrlC 











# 现 在 是 普通 运行 的 结尾 
多 clear_up; 





变量 %SIG 的 赋值 将 激活 handler 直到 撤销 为 止 。key 为 没有 前 绥 SIG 的 信号 名 ， 值 为 没有 多 的 子 程序 名 争 。 从 这 里 开始 ， 
如 果 有 SIGINT，Pezl 会 停止 当前 的 处 理 ， 跳 转 到 子 程序 处 。 我 们 的 子 程序 清空 临时 文件 并 退出 。( 如 果 没 有 按 下 Ctrl-C， 
我 们 仍 在 程序 的 结尾 处 调用 &clean_up。) 





















































多 其 值 也 可 以 是 子 程序 的 引用 ， 但 这 里 我 们 没有 这 样 做 。 





如 果子 程序 是 返回 而 不 是 退出 ， 程 序 则 会 继续 在 它 中 断 的 地 方 执行 。 这 在 需要 中 断 而 非 停 止 运行 的 情况 下 是 有 用 的 。 例 如 ， 
假设 处 理 文件 的 每 一 行 均 要 花 几 秒 的 时 间 ， 这 是 很 慢 的 ， 你 想 在 中 断 发 生 且 其 不 是 正在 处 理 一 行 的 时 候 ， 将 整个 进程 停止 
掉 。 在 程序 中 设置 一 个 flag， 在 每 一 行 处 理 完 毕 时 检查 它 : 





























my $int_count; 


Sub my_int_handler {$int_count++} 


$int_count=0; 
while(<SOMEFILE>){ 
光 某 些 处 理 花 了 几 秒 钟 时 间 … 
让 ($int_count) { 
# 中 断 发 生 


print“[processing interrupted...]\n”; 





]last; 
} 
} 
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当 每 一 行 处 理 时 ，$int_count 的 值 可 能 是 0 如 果 没 人 按 下 CtrLC, 因此 循环 会 继续 处 理 下 一 行 。 但 是 ， 如 果 中 断 发 生 ， 则 中 
上 断 处 理 部 分 会 增加 $count_int， 当 在 结尾 处 检测 到 它 时 ， 循 环 退 出 。 
































因此 ， 可 以 设置 flag 或 退出 程序 ， 这 几乎 是 捕 换 信号 最 常用 的 。 当 前 singal handlers 的 实现 并 非 完美 无 缺 的 争 ， 因 此 ， 尽 量 
减少 这 一 部 分 ， 和 否则 某 一 天 你 的 程序 可 能 出 现 你 意 想 不 到 的 事 。 













































































银 这 是 Perl 开发 者 要 修正 的 首要 问题 ， 因 此 我 们 期 望 在 Perl6 中 可 靠 的 信号 处 理会 是 其 首要 的 新 功能 之 一 。 问 题 是 信号 可 能 任何 时 候 发 生 
至 在 Perl 还 没准 备 好 的 时 候 。 如 果 Perl 正在 分 配 内 存 而 此 时 信号 产生 了 , singal handler 可 以 意外 的 分 配 一 些 内 存 ， 而 你 的 程序 就 死 了 。 
Perl 代码 分 配 内 存 时 ， 你 是 不 能 控制 的 ， 但 XSUB 代码 《〈 通 第 由 C 书写 ) 可 以 安全 的 处 理 信 号 。 参 照 Perl 文档 ， 了 解 更 多 的 关于 这 


沾 
些 高 级 话题 的 信息 。 

















































































































14.， 8 练习 














1 [@ 写 一 个 程序 可 以 转 到 某 个 特定 的 《〈 写 入 代码 中 的 ) 目录 ， 如 系统 的 根 目 录 ， 再 执行 ls -1 得 到 那个 目录 的 目录 列表 。 
《如 果 你 的 是 non-Unix 系统 ， 使 用 你 自己 的 系统 命令 ， 得 到 那个 目录 的 详细 列表 ) 























2 [10] 修 改 第 一 题 的 程序 ， 将 结果 输出 到 当前 目录 的 文件 ls.out 中 。 错 误 的 结果 输出 到 文件 ls.err 中 。( 你 不 需要 做 任何 特 
殊 的 事 ， 这 两 个 文件 中 的 任意 一 个 都 可 能 是 空 的 。) 






































3， [g 写 一 个 程序 能 解析 date 命令 的 输出 ， 判 断 当 前 日 期 是 一 个 星期 的 第 儿 天 。 如 果 是 weekday 〈 周 一 至 周 五 )， 则 输出 
get to work 否则 ， 输 出 go play。date 命令 的 输出 如 果 是 由 Mon 开头 ， 则 指 星期 一 儿 。 如 果 你 的 non-Unix 系统 没有 
date 命令 ， 则 伪造 一 个 程序 使 之 可 以 输出 像 date 命令 那样 的 结果 。 我 们 这 里 给 你 提供 一 个 两 行 的 程序 ， 如 果 你 答应 不 
问 我 们 它 工作 的 原因 ， 



































合 至 少 当 这 些 星 期 几 是 由 英文 输出 的 时 候 。 你 应 当 根据 你 的 系统 调整 它 ， 如 果 你 的 系统 不 是 这 样 。 





























#! /usrYbin/perl 
Print localtime(O .Am ”; 
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第 十 五 章 Perl 模块 





Perl 除了 本 书 介绍 的 之 外 ， 还 有 许多 内 容 ， 并 且 还 有 许多 人 利用 Perl 做 了 大 量 有 趣 的 事 。 如 果 有 一 个 问题 需要 解决 ， 那 很 
可 能 已 丝 有 人 解决 ， 并 把 它 放 在 CPAN 〈 全 面 Perl 归档 网 络 (Comprehensive Perl Archive Networg)) 上 了 。 它 分 布 在 世界 各 
地 的 服务 器 及 镜像 上 ， 其 中 有 成 千 上 万 的 可 以 复 用 的 Perl 代码 。 







































































如 果 想 学 习 如 何 写 模 块 ， 可 以 参见 羊 驼 书 (Alpaca bool)。 本 章 ， 我 们 将 介绍 如 何 使 用 已 经 存在 的 模块 。 


1S$. 1 查找 模块 


从 两 种 途径 可 以 得 到 模块 : Penl 发 布 包 中 附带 的 以 及 从 CPAN 中 下 载 并 安装 的 。 除 非特 别 说 明 ， 我 们 讨论 的 模块 是 Perl 发 
布 包 中 附带 的 。 











需要 Perl 发 布 包 中 没有 的 模块 ， 可 以 在 CAPN 上 : http://search.cpan.org, 或 kobes” 上 : http:/kobesearch.cpan.org@ 查 找 。 可 
以 在 上 面 找 到 你 需要 的 模块。 




















急 是 的 ，URL 中 应 当 是 : ss,， 但 没 人 提 到 这 个 问题 也 没 人 修正 它 。 











你 可 以 在 下 载 整个 包 之 前 先 阅读 关于 此 模块 的 文档 。 也 可 以 浏览 文件 ， 而 不 用 先 安装 。 


























在 打算 网 上 查找 模块 之 前 ， 先 检查 其 是 和 否 已 经 安装 。 方 法 之 一 是 使 用 perldoc 相应 文档 。 例 如 CGIpm 是 随 Perl 发 布 的 一 个 
模块 〈 我 们 将 在 本 章 后 面 讨 论 )， 你 可 以 如 下 的 阅读 其 文档 : 























$perldoc CGI 





尝试 阅读 一 个 不 存在 的 模块 的 文档 ， 将 得 到 一 条 出 错 信 ， 


[ 亚 





$perldoc Llamas 


$ No documentation found for “Llamas”. 


你 系统 上 的 文档 ， 也 可 能 以 其 它 的 格式 存在 ， 例 如 HTML: 








急 我 们 在 羊 驼 书 中 (Alpaca boog) 中 履 盖 了 Perl 的 文档 ， 许 多 模块 的 文档 和 实际 的 代码 在 同一 个 文档 之 中 。 


15，2 安装 模块 









































当 想 安 装 没有 的 模块 时 ， 通 常 只 需 下 载 相应 的 包 ， 解 压 ， 再 在 shell 中 运行 一 些 命 令 。README 或 1N8747Z 能 给 你 更 多 的 
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信息 。 如 果 模 块 使 用 了 MakeMaker 急 ， 则 需 运 行 的 命令 大 致 如 下 : 





急 也 就 是 Perl 模块 : ExtUtils::MakeMaker， 随 


需 的 指令 。 


$ perl Makerfile.PL 


$make install 





Perl 一 起 发 布 。 它 能 根据 已 知 信息 来 建立 文件 ， 而 这 个 文件 包含 针对 你 的 系统 安装 Perl 所 











如 果 在 默认 目录 中 不 能 安装 ， 你 可 以 针对 Makerji1e.PLZ 使 用 PREFIX 这 个 参数 来 指定 目录 。 


$ perl Makerfile.PL PREFIX=/Users/fred/lib 





一 些 模块 的 创 





$ perl Build.PL 
$./Build install 


者 使 用 另 一 个 模块 : Module::Build, 来 构造 及 安装 他 们 的 模块 。 此 时 的 命令 如 下 : 


某 些 模块 依赖 于 其 它 模 块 ， 除 非 已 经 把 这 些 模块 已 经 安装 上 了 ， 和 否则 其 不 能 工作 。 自 己 可 以 不 做 这 些 工 作 ， 我 们 可 以 利用 














Perl 自 带 的 一 个 模块 : CE4Npzm 急 。 在 命令 行 中 ， 你 可 以 启用 CEMAN.pm 这 个 shell， 其 中 你 可 以 输入 命令 。 





急 扩 展 名 .pm 表示 “Perl Module。 ”一 些 流行 模 





























块 的 发 音 会 加 上 “.pm” 来 表明 其 的 不 同 点 。 例 如 ，CPAN 表示 全 面 Perl 存档 网 络 时 其 含义 























是 不 同 于 CPAN 这 个 模块 的 ， 后 者 被 读 作 :“CPAN.pm.” 


$perl-MCPAN -e shell 











甚至 上 述 做 法 也 是 复杂 的 ， 因 此 以 前 我 们 中 一 位 写 了 一 个 叫做 cpan 的 脚本 ， 它 随 Perl 发 布 。 只 需 在 这 个 脚本 后 接 需 要 安装 


的 模块 的 列表 。 














$ cpan Module::CoreList LWP CGI::Prototype 





你 可 能 说 :“ 我 没有 命令 行 !” 如 果 使 用 的 是 ActiveState 移植 的 Perl(Windows, Linux， 或 Solaris)， 你 可 以 使 用 Perl 包 管 理 器 
(Perl Package Manger(PPM) ) 争 , 它 可 以 帮助 你 安装 模块 。 甚 至 可 以 使 用 ActiveState 的 CD 或 DVD 进行 安装 争 。 你 的 系统 中 
可 能 有 特有 的 安装 软件 的 方法 ， 包 括 Perl 模块 。 


























令 http :/aspn.activestate.com/ASPIN/docs/ActivePerl/faq/ActivePerl-faq2.html. 











急 你 也 可 以 自己 制作 CD 或 DVD 来 存储 资料 。 
































1S$. 3 使 用 简单 的 模块 





假定 在 程序 中 得 到 了 像 hpsr1ocaVWBpipperl 这 相 
blei@163.com 
































虽然 CPAN 现在 大 约 有 3GB， 但 “minicpan”( 也 是 我 们 中 的 一 位 作者 写 的 ) 可 以 将 其 整理 ， 





只 保留 最 新 的 所 有 信息 ， 大 约 为 5S00MB。 人 参见 CPAN::Mini 模块 。 


的 文件 名 ， 需 要 确定 其 基本 名 字 (basename)。 这 是 很 容易 的 ， 因 为 基本 名 字 
1841201 9/21/2006 
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是 最 后 一 个 斜 线 后 的 部 分 〈 本 例 中 是 ，Pper1): 





Imy $name = "yusrlocalMbin/perl”; 


(my $basename = $name) =~ S#. 兴 /##。 #ODopS! 





和 在 前 面 遇 到 的 一 样 ，Perl 首先 进行 括号 内 的 赋值 运算 ， 再 进行 奉 换 。 替 换 操 作 的 意思 是 将 任何 以 斜 线 结尾 的 字符 串 〈 也 
就 是 ， 路 径 名 部 分 ) 用 空 串 替换 ， 基 本 名 字 不 变 。 





























如 果 使 用 这 样 的 代码 ， 看 起 来 能 正常 工作 。 是 的 ， 它 只 是 看 起 来 能 ， 事 实 上 这 里 有 三 个 问题 。 




















第 一 ，Unix 文件 或 目录 可 以 包含 换行 符 。( 它 虽然 不 常 出 现 ， 但 是 允许 的 。) 由 于 正则 表达 式 的 点 () 不 能 匹配 换行 符 ， 因 此 
像 '/home/fred/flintstone\n/brontosaurus” 这 样 的 字符 串 就 不 能 正常 处 理 ， 因 为 它 认 为 基本 名 字 是 “flintstone\n/brontosaurus”。 你 
可 以 在 模式 后 使 用 /s 这 个 选项 来 解决 这 个 问题 〈 如 果 你 知道 这 种 极 少 出 现 的 情况 )， 将 模式 写成 : s#.%W##s。 第 二 ， 这 只 是 
针对 Unix 的 。 这 假定 了 目录 的 分 隔 符 是 正 斜 线 0/) 而 不 是 其 它 系 统 中 的 反 和 斜 线 CA) 或 冒号 。 


























第 三 个 〈 最 大 的 ) 问题 是 ,我 们 在 解决 一 个 别人 已 经 解决 过 的 问题 。Penl 自 带 有 许多 模块 ， 它 们 漂亮 的 扩展 了 Penl 的 功能 。 
如 果 这 些 还 不 够 ， 你 还 可 以 从 CPAN 得 到 更 多 的 模块 ， 并 且 每 周 都 有 新 的 模块 加 入 CPAN。 你 〈 或 者 ， 更 好 是 ， 你 的 系统 
管理 员 ) 在 你 需要 相应 的 功能 时 ， 可 以 安装 它们 。 




















在 本 节 剩 余部 分 ， 我 们 将 介绍 如 何 使 用 Perl 附带 的 一 些 模 块 。( 这 些 模块 能 作 许 多 
括 描述 。) 





。 这 里 只 是 如 何 使 用 这 些 模块 的 一 个 概 























我 们 不 能 将 所 有 你 需要 知道 的 如 何 使 用 模块 的 知识 都 告诉 你 ， 因 为 使 用 茶 些 模块 需要 对 一 些 高 级 的 知识 如 引用 ， 对 象 有 了 
解 争 。 这 些 知 识 ， 包 括 如 何 创建 模块 ， 在 Alpaca 书 中 有 详细 的 描述 。 
































急 在 下 面 的 讨论 中 ， 你 可 以 在 不 了 解 这 些 知 识 前 使 用 那些 使 用 了 引用 ， 对 象 的 模块 。 


























15. 3. 1. File::Basename 模块 








上 例 中 ， 从 文件 名 (filename ) 中 得 到 基本 名 字 (basename) 的 方法 不 是 可 移植 的 。 我 们 说 明了 某 些 看 起 来 直观 的 解决 方法 是 
可 疑 的 ， 某 些 假 定 甚至 是 错误 的 。( 如 换行 符 不 会 出 现在 文件 和 目录 名 中 的 假设 ) 我 们 还 重新 制造 轮子 ， 解 决 别人 已 经 解决 
过 的 问题 。 


























还 有 一 种 更 好 的 从 文件 名 得 到 基本 名 字 的 方法 。Penl 附带 了 一 个 叫做 File::Basename 的 模块 。 使 用 命令 perldoc 
File::Basename， 或 者 你 系统 中 的 文档 ， 可 以 阅读 其 功能 ， 这 是 使 用 新 模块 第 一 步 应 做 的 事情 。( 但 通常 是 第 三 步 ， 或 第 五 
步 ) 






































由 


你 准备 好 使 用 它 时 ， 在 程序 顶端 用 use 声明 它 : 银 




















多 在 程序 顶端 声明 横 块 是 一 种 传统 ， 因 为 这 样 有 利于 维护 人 员 知 道 你 使 用 的 模块 。 例 如 ， 当 在 一 台新 机 器 上 安装 程序 时 ， 将 节约 你 大 量 的 
时 间 。 











use File::Basename; 
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编译 时 ，Perl 发 现 这 行 代码 ， 将 相应 的 模块 载 入 。 现 在 在 本 程序 后 面 就 有 了 一 些 新 的 函数 可 供 使 用 。 我 们 早期 的 例子 所 需 
的 是 basename 函数 : 





























Imy $name = "yusrlocalMbin/perl”; 


my $basename = basename $name; # 得 到 “per 


上 述 代 码 在 Unix 系统 中 能 正确 运行 。 在 MacPerl, Windows, VMS, 或 者 别 的 系统 中 呢 ? 这 不 会 有 任何 问题 ， 因 为 这 个 模块 知 
道 你 的 系统 的 类 型 ， 它 会 默认 使 用 你 的 系统 的 文件 名 规则 。( 此 时 ， 在 $name 存放 的 flename 应 和 你 的 系统 一 致 。) 











这 个 模块 还 提供 了 其 它 的 函数 。 其 中 之 一 是 dirname 函数 ， 它 可 以 从 一 个 全 文件 名 中 得 到 目录 名 。 这 个 模块 还 可 以 让 你 将 
文件 名 及 其 扩展 名 分 隔 开 ， 或 者 改变 默认 的 文件 名 规则 拿 。 











急 你 可 能 需要 改变 文件 名 的 规则 ， 如 在 一 台 Windows 的 机 器 上 处 理 Unix 机 器 上 的 文件 名 ， 例 如 在 FTP 连接 上 发 送 命令 。 




















15. 3. 2. 仅 使 用 模块 中 的 一 些 函 数 


假定 需要 在 以 前 的 程序 中 加 入 File::Basename， 同 时 你 发 现 有 一 个 子 程序 叫做 : &dirname。 因 此 ， 你 有 一 个 子 程序 其 名 字 和 
此 模块 中 的 一 个 函数 同名 争 。 麻 烦 的 地 方 是 这 个 新 的 dirname 已 经 被 作为 Per 的 子 程序 〈 在 模块 内 )， 该 怎么 办 呢 ? 


























争 当 然 ， 你 自己 的 &dirname 子 程序 的 作用 可 能 也 是 类 似 的 ， 这 里 只 是 作为 一 个 例子 。 某 些 模块 有 上 百 个 函数 ， 这 将 提高 名 字 冲 突 的 概率 。 























例如 File:Basename， 在 use 声明 中 ， 可 以 使 用 输入 列表 (iportst) 来 指定 所 需 的 函数 ， 那 它 将 只 提供 这 些 函 数 。 下 例 ， 


将 只 给 出 basename ; 





use File:Basename dqw/ basename / 














下 例 ， 我 们 不 使 用 任何 函数 ; 


use File:Baename qw//; 


这 通 芝 写成 : 


Use File:Basename ( ); 

















我 们 为 什么 要 这 么 做 呢 ? 这 明确 的 要 求 Perl 像 以 前 那样 载 入 File:Basename ， 但 不 引入 任何 的 函数 名 。 如 果 引 入 的 话 ， 我 们 
就 可 以 使 用 这 些 短 的 ， 简 单 的 函数 名 如 : basename，dirname。 如 果 没 有 引入 这 些 名 字 ， 我 们 仍然 能 使 用 它们 。 当 没有 引入 
时 ， 我 们 可 以 使 用 它们 的 全 名 来 调用 ， 






































use File:Basename qw/ /; # 没 有 引入 函数 











my $betty = &dirmname($wilma); # 使 用 我 们 自己 的 子 程序 &dirname( 这 里 没有 显示 ) 





my $name = '“VusrlocalMbin/perl”; 
blei@ 163.com 186 / 201 9/21/2006 


Perl 语言 入 门 (第 四 版 ) 








my $dirname = File::Basename::dirname $name; # 使 用 模块 中 的 dirname 














模块 中 dirname 函数 的 全 名 是 File::Baename::dirname 。 我 们 总 是 可 以 使 用 函数 的 全 名 ， 一 旦 我 们 将 模块 载 入 ， 无 论 是 否 引 
入 dirname， 我 们 均 可 以 使 用 全 名 。 

















许多 时 候 ， 希 望 使 用 模块 的 默认 引入 列表 。 但 可 以 使 用 你 自己 的 列表 来 改变 这 种 默认 行为 。 使 用 你 自己 的 列表 的 另 一 个 理 
由 是 ， 你 想 引 入 某 些 函数 ， 而 这 些 函数 不 在 默认 的 列表 之 中 ， 因 为 许多 模块 包含 〈 不 常用 的 ) 函数 ， 这 些 函 数 不 在 默认 的 
引入 列表 中 。 




















某 些 模块 ， 在 默认 的 情况 下 ， 比 别 的 模块 引入 更 多 的 记号 〈symbolb) 。 每 一 个 模块 的 文档 会 仔细 指出 它 所 引入 的 记号 ， 当 然 
你 总 是 可 以 改变 这 些 默 认 的 引入 列表 ， 如 File::Basename。 引 入 的 就 是 没有 任何 记号 的 空 表 。 





15. 3. 3. File::Spec 模块 





现在 你 可 以 找 出 一 个 文件 的 basename 。 这 是 很 有 用 的 ， 但 有 时 你 可 能 希望 将 它 和 目录 名 一 起 组 合成 一 个 全 文件 名 〈full 
filename)。 例 如 ， 你 想 在 文件 名 如 omemootpeeice-2.71.txxt 的 basename 前 加 入 前 绥 : 








Use File::Basename; 


Print “Please enter a filename:”; 
chomp(my $old_name = <STDIN>); 


my $dirname = dirname $old_name; 
my $basename = basename $old_name; 


$basename =~ S/MWnot;， # 在 basename 前 加 入 前 绥 
my $new_name = '$dirname/$basename”; 


rename($old_name, $new_name) 


Or warn “Can't rename “old_name'to '$new_name”: $7”; 








你 


芯 


发 现 了 其 中 的 问题 吗 ? 我 们 又 一 次 假定 了 文件 名 是 按照 Unix 习惯 : 在 目录 名 和 basename 之 前 使 用 正 斜 线 分 开 来 的 。 幸 
的 是 ，Perl 提供 了 一 个 横 块 来 处 理 这 种 问题 。 








模块 File::Spec 用 来 处 理 文件 规范 的 (ije specifications)， 如 文件 名 ， 目 录 名 ， 以 及 一 些 别 的 存在 在 文件 系统 中 的 信息 。 同 
File::Basename 一 样 ， 它 知道 其 操作 系统 的 类 型 ， 因 此 会 自动 选择 正确 的 规则 来 处 理 。File::Spec 和 File::Basename 不 同 的 地 
方 是 : 它 是 面向 对 象 (简称 "DO”) 的 模块 。 



































如 果 对 "00" 不 了 解 ， 不 用 担心 。 如 果 知 道 对 象 ， 那 非常 好 ;你 可 以 使 用 这 些 “O0” 模 块 。 如 果 不 知道 对 象 ， 也 同样 无 押 谓 。 
输入 下 面 的 代码 ， 它 同样 能 正常 工作 。 















































这 里 ， 我 们 阅读 File::Spec 的 文档 ， 想 使 用 其 中 catfile 这 个 方法 (metpod) 什么 是 metpod? 它 是 一 种 不 同类 型 的 函数 ， 此 
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时 我 们 只 关心 这 么 多 。 它 们 的 不 同 点 在 于 ， 当 从 File::Spec 中 调用 一 个 方法 时 ， 需 要 使 用 全 名 ， 如 ; 





Use File::9pec; 


# 得 到 上 面 的 $dirname, $basename 的 值 


my $new_name = File::Spec->catfile($dqirname, $basenamey); 


Tename($old_name, $new_name) 


Or warn “Can't rename '$old_name'to “$new_name': $; 





方法 的 全 名 是 模块 的 名 字 〈 此 时 叫做 类 )， 小 箭头 〈->)， 以 及 方法 的 短 名 字 。 这 里 使 用 小 箭头 而 非 像 File::Basename 的 双 冒 


写 。 
































日 于 我 们 调用 方法 使 用 的 是 全 名 ， 那 引入 了 哪些 符号 呢 ? 一 个 也 没有 。 这 对 于 OO 模块 是 普遍 的 。 你 不 需要 担心 你 有 一 个 
子 程序 的 名 字 同 File::Spec 中 某 个 方法 同名 。 














觉得 使 用 这 些 模块 很 麻烦 吗 ? 你 如 果 能 保证 你 的 程序 只 在 Unix 机 器 上 运行 ， 且 你 完全 知道 Unix 的 文件 名 规则 ， 那 么 你 可 
以 将 你 自己 的 这 些 假设 写 入 代码 中 。 但 这 些 模块 给 你 提供 了 让 程序 更 健壮 ， 更 具 移 植 性 ， 并 且 是 不 需要 付出 任何 额外 代价 
的 方法 。 


















































15. 3. 4， CGIl.pm 








如 果 要 创建 CGI 程序 (我 们 在 本 书 中 不 打算 全 面 介绍 ), 可 以 使 用 CGILpm 模块 。 不 需要 处 理 脚本 的 接口 以 及 输入 解析 部 分 ， 
这 些 部 分 让 太 多 人 陷入 麻烦 。CGILpm 的 作者 ，Lincoln Stein， 花 了 大 量 时 间 确 保 它 能 在 大 多 数 服 务 器 及 操作 系统 中 能 正确 
处 理 。 使 用 这 个 模块 ， 并 把 注意 力 放 在 脚本 中 有 趣 的 部 分 。 


















































CGI 模块 提供 了 两 种 方法 ， 一 种 是 普通 的 老式 函数 接口 ， 一 种 是 OO 接口 。 我 们 使 用 第 一 种 。 和 前 面 一 样 ， 我 们 可 以 模仿 
CGIpm 模块 中 的 例子 。 在 引入 列表 (import lisb 时 ， 我 们 使 用 :al， 这 是 一 个 exportag， 将 一 次 指定 一 组 函数 而 非 像 在 前 
面 模块 中 看 到 的 那样 只 是 单个 函数 合 。 












































多 








急 这 个 模块 还 有 其 它 的 能 选择 一 组 函数 export tags。 例 如 ， 如 果 想 使 用 处 理 CGI 的 那些 ， 可 以 使 用 :cgi， 如 果 想 使 用 生成 HTML 的 函数 ， 
可 以 使 用 :html4 。 查 看 CGILpm 文档 了 解 更 多 的 信息 。 
































#! /usrbin/perl 


use CGI qw(:al); 


Print header( textplain”); 


foreach my $param ( param()) 


{ 
Print “$param:“. param($param) . An”; 
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} 


如 果 想 以 HTML 的 格式 输出 , CGILpm 有 许多 函数 可 以 方便 的 做 到 。 可 以 使 用 start_html0) 来 处 理 HTML 的 头 ， 
标签 和 相同 名 字 的 相应 函数 ， 如 h10 指 <H1> 标 签 。 





#! /usrbin/perl 
use CGI qw(:al); 


Print header()， 
Start_html(“This is the page title”)， 


hl( ”Input parameters”); 
my $list_items; 
foreach my $param ( param0) ) 
| 
$list_items .= 1(“$param:”. param($paramy) ); 


print ul ( $list_items ); 


print end_html(0; 











是 不 是 很 容易 ? 你 不 需要 知道 CGILpm 是 如 何 处 理 的 ; 你 只 需要 相信 它 能 正确 进行 处 理 。 当 把 困难 的 部 分 交 给 CGLpm 处 理 

















时 ， 你 就 可 以 集中 精力 在 程序 中 更 有 趣 的 部 分 。 




















许多 的 HTML 





CGILpm 还 能 做 更 多 的 事情 ， 如 处 理 cookies， 重 定向 Gedirectiom)， 以 及 多 页 窗 体 (multi-page forms)。 你 可 以 从 文档 的 例子 
中 学 到 更 多 的 知识 。 


15. 3. 5. 数 据 库 和 DBI 





























DBI (数据 库 接口 (database interface)) 模块 不 是 Perl 默认 附带 的 ， 但 它 是 最 常用 的 模块 之 一 ， 因 为 大 多 数 有 




















日 户 都 需要 连接 


到 某 种 类 型 的 数据 库 上 。DBI 漂亮 的 地 方 在 于 ， 对 于 绝 大 多 数 常 用 的 数据 库 ， 其 接口 都 是 一 样 的 ， 从 csv 〈comma-separated 
value) 文件 到 大 型 的 数据 库 服务 器 如 Oracle。 它 有 ODBC 的 驱动 程序 ， 某 些 驱 动 程序 是 由 厂商 提供 的 。 想 了 解 全 面 的 详细 





























信息 ， 可 以 参见 Perl DBI 编程 Porgramming the Per DBD 〈O'Reilly)。 也 可 以 查看 DBI 的 网 站 : http:/dbi.perl.org/。 























据 数据 库 服务 器 ， 及 其 版 本 安装 正确 的 数据 库 驱 动 程序 。 





























当 安 装 了 DBI 后 ， 也 需要 安装 DBD (数据 库 驱 动 程 序 (database driven )。 从 CPAN 上 搜索 DBD， 会 返回 一 长 串 的 结果 。 根 


DBI 是 一 个 00 模块 ， 但 不 需要 完全 了 解 00 编程 之 后 才 开 始 使 用 它 ; 根据 文档 中 的 例子 就 可 以 开始 了 。 要 连接 数据 库 ， 











需要 use DBI 模 块 ， 并 调用 connect 方法 。 


use DBL: 


$dbh = DBI->connect($data_source, $username, $password); 
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$data_source 含有 需要 使 用 的 DBD 的 信息 。 对 于 PostgreSQL ， 驱 动 是 DBD::Pq， 则 $data_source 看 起 来 如 下 : 


my $data_source = “dbi:Pg:dbname=7a1ze_oj datapase ” 





一 旦 连接 上 数据 库 后 ， 则 进入 了 preparing, executing, reading 查询 的 循环 。 








$sth = $dbh->prepare('SELECT * FROM foo WHERE bla 妆 ); 


$sth->execute( ); 
@row_ary = $sth->fetchrow_array; 
$sth->finish; 





当 结束 时 ， 需 要 断 开 和 数据 库 的 连接 。 


$dbh->disconnect( ); 


参阅 DBI 的 文档 了 解 更 多 的 信息 。 





1S$. 4 练习 








1. 015] 从 CPAN 上 安装 Module::CoreList 这 个 模块 。 打 印章 














版 本 的 Perl 所 带 的 模块 的 名 字 ， 使 用 下 面 的 代码 : 








my %modules = %{%module::CoreList::version{S.000】} 





H Perl5.006 所 附带 的 所 有 模块 。 创 建 一 个 hash， 其 keys 为 给 定 








已 

















2 [15] 获 得 当前 目录 文件 名 的 列表 。 使 用 C<Cwd> 模 块 得 到 当前 的 目录 ， 再 使 用 C<EFile::Spec> 模 块 将 目录 名 和 文件 名 结 
合 起 来 得 到 绝对 路 径 (absolute path) 。 将 此 路 径 输 出 在 标准 输出 设备 上 ， 一 行 一 条 。 你 的 解雇 方案 应 当 可 以 移植 到 其 它 





系统 之 中 。 
































3. [15] 利 用 前 一 题 的 得 出， 将 其 读 入 路 径 的 列表 中 ， 再 使 用 C<File::Basename> 模 块 ， 将 文件 名 从 中 分 离 出 来 。 输 出 文件 











名 。 你 的 解决 方案 应 当 可 以 移植 到 其 它 系 统 之 中 。 
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第 十 六 章 一 些 高 级 的 Perl 技术 








我 们 到 现在 为 止 介绍 的 都 是 Perl 最 核心 的 部 分 ， 每 一 个 Penl 使 用 者 都 应 当知 道 。 还 有 些 别 的 技术 ， 它 们 不 是 必需 的 ， 但 也 
非常 有 用 。 我 们 将 其 中 最 重要 的 部 分 收集 在 本 章 中 。 






































不 要 被 本 章 的 标题 所 误 导 ; 这 些 技术 并 不 比 本 书 其 余部 分 难于 理解 。“ 高 级 的 ”含义 仅仅 指 它 们 对 于 初学 者 不 是 必需 的 。 第 
一 次 阅读 本 书 时 ， 你 很 可 能 想 跳 过 《或 浏览 》 本章， 而 直接 开始 使 用 Perl。 当 你 准备 了 解 更 多 的 Perl 时 ， 再 回 过 头 来 阅读 。 
把 整 章 看 作 脚 注 争 。 


AAA 


























急 我 们 在 章 稿 中 是 这 么 打算 的 ， 但 被 O'Reilly 的 编辑 坚定 的 否决 了 。 





16. 1 利用 eval 捕获 错误 


有 时 ， 你 程序 中 某 段 普通 代码 可 能 引起 严 











错误 (fatal errors)。 例 如 ， 下 面 这 些 均 能 让 你 的 程序 裔 省 ， 














$barney = $fred / $dino; # 除 数 为 0 的 错误 ? 
print“matchv” 让 /AGwilma)/;  # 非 法 的 正则 表达 式 的 错误 ? 


open CAVEMAN, fred # 用 户 产 生 的 错误 ? 
or die“Can't open file '$fred' for input: $ 忆 ”; 

















如 果 不 怕 麻烦 ， 可 以 捕捉 到 一 些 这 种 类 型 的 错误 ， 但 很 难 考虑 周全 。( 你 怎样 检测 上 例 中 的 $wilma 字符 串 ， 以 保证 它 是 一 
个 合法 的 正则 表达 式 呢 ?7 ) 庆幸 的 是 ，Perl 提供 了 处 理 严 重 错误 的 方法 : 将 这 些 代 码 放 入 eval 块 中 : 




















eval { $barmey = $fred / $dino }; 











甚至 当 $dino 为 0 时 ， 上 述 代码 也 不 会 让 程序 寺 溃 。eval 是 一 个 表达 式 〈 不 是 像 while 或 foreach 那样 的 控制 结构 )， 因 此 结 
尾 处 的 分 号 是 必须 的 。 














当 执 行 eval 块 时 发 生 了 通常 的 严重 错误 ，eval 块 会 停止 执行 ， 但 程序 不 会 朋 溃 。 当 eval 结束 时 ， 你 想 知 道 它 是 正常 结束 的 ， 
还 是 发 生 了 严重 错误 。 这 些 结果 放 在 特殊 变量 $@ 之 中 。 如 果 eval 为 你 捕捉 了 严重 错误 ， 则 $@ 中 将 有 程序 失败 的 原因 ， 可 
能 如 : Ilegal division by zero at my_program line 12。 如 果 没 有 错误 , 则 $@ 为 空 。 这 意味 着 $@ 是 一 个 有 用 的 Boolean (true/false) 
值 ( 真 ， 表 示 有 错误 )， 因 此 可 能 在 eval 块 后 看 到 如 下 的 代码 ; 









































print “An error occurred: $@” 让 $@; 














eval 块 是 真正 的 一 个 块 ， 因 此 其 中 可 以 有 新 的 局 部 (my) 变量 。 下 面 的 程序 演示 了 一 个 eval 块 : 
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foreach my $person (qw/ fred wilma betty barney dino pebbles /) { 
eval { 
open FILE,“<$personm” 


or die “Can"t open file '$person : $!”; 


Imy($total, $count); 


while (<FILE>){ 
$total += $ ; 
$count++; 


| 


Imy $average = $total/$count; 


print“Average for file $person was $averageNn”; 


作 do_something($person, $average); 


上 


让 ($@){ 
Print “An error occurred ($@), continuing\n”” 
} 
) 























这 里 捕捉 了 多 少 严重 错误 呢 ? 如 果 打 开 文 件 时 出 了 一 个 错误 ， 这 个 错误 则 被 捕捉 。 计 算 平 均 数 时 ， 除 数 可 能 为 0 ， 这 个 错 
误 也 将 被 捕 提 。 甚 至 &do_something 这 个 子 程序 ， 由 于 其 也 在 eval 块 之 内 ， 同 样 受到 eval 的 保护 ，eval 块 会 捕捉 任何 在 其 
运行 期 间 的 严重 错误 。( 这 个 功能 是 非常 方便 的 ， 如 果 调 用 别人 的 程序 ， 但 你 不 知道 这 些 代 码 是 否 足 够 强壮 ， 这 样 能 避免 让 
你 的 程序 骨 误 。) 












































当 处 理 某 个 文件 时 出 现 了 错误 ， 我 们 得 到 这 个 错误 信息 ， 但 程序 不 会 因此 停 下 来 ， 会 继续 处 理 下 一 个 文件 。 




















可 以 将 eval 块 进行 嵌 套 。 内 层 捕捉 它 运 行 时 候 的 错误 〈 当 内 层 的 eval 结束 时 ， 你 可 能 希望 使 用 die 将 这 些 错误 在 输出 来 ， 
因此 外 层 的 eval 可 以 捕捉 它 。) 一 个 eval 块 捕 提 任何 它 运 行 时 发 生 的 错误 ， 包 括 其 调用 的 子 程序 的 错误 《如 前 面 的 例子 。) 



































eval 是 一 个 表达 式 ， 这 就 是 为 什么 需要 结尾 的 分 号 来 关闭 花 括 号 的 原因 。 由 于 是 一 个 表达 式 ， 则 有 一 个 返回 值 。 如 果 没有 
错误 ， 就 像 任何 的 子 程序 一 样 :返回 值 为 最 后 一 个 被 求 值 的 表达 式 的 值 ， 或 者 是 由 retum 返回 的 值 。 下 面 是 另 一 种 进行 这 
种 数学 运算 而 不 担心 除数 是 否 为 0 的 做 法 ; 










































































my $barney = eval { $fred /$dino }; 





如 果 eval 捕捉 到 了 严重 错误 ， 则 返回 值 为 undef 或 空 列 表 ， 依 赖 于 其 contexbe 因此 ， 在 前 面 的 例子 中 ，$barney 为 除法 运算 
的 正确 值 ， 或 者 是 undef。 我 们 不 需要 在 继续 使 用 之 前 检测 $@ ， 虽 然 之 前 进行 检测 defined ($barney) 是 一 个 好 主意 。 





















































有 四 种 类 型 的 问题 不 能 由 eval 捕捉 。 第 一 种 是 严重 到 可 以 让 Perl 骨 溃 的 错误 ， 如 内 存 耗 光 。 由 于 Perl 没有 运行 ， 它 不 能 捕 
捉 这 些 错误 争 。eval 块 中 的 语法 错误 会 在 编译 时 被 发 现 ， 因 此 它们 也 不 会 出 现在 $@ 之 中 。 
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多 某 些 这 种 类 型 的 错误 在 perldiag 的 用 户 手 册 中 被 标记 有 (X)， 如 果 你 感 兴趣 的 话 。 




















exit 会 立刻 终止 一 个 程序 的 运行 ， 即 便 是 在 eval 块 内 的 子 程序 中 调用 的 。 这 明确 上 暗示 了 ， 当 写 子 程序 时 ， 应 当 使 用 die 而 非 
exit 来 表示 程序 出 了 问题 。 





























第 四 个 不 能 由 eval 块 捕 提 的 问题 是 warmnings: 无 论 是 用 户 产 生 的 (从 warn 中 ) 或 者 Perl 内 部 产生 的 《在 命令 行 中 使 用 -w 参 
数 ， 或 者 使 用 use wamings pragma )。eval 中 有 一 种 分 离 出 来 的 机 制 来 捕捉 warnings 。 查 看 Perl 文档 中 关于 __ WARN_ 的 


论述 。 












































eval 还 有 一 种 形式 ， 如 果 错 误 使 用 将 非常 爷 险 。 有 时 ， 你 可 能 遇 到 某 人 告诉 你 在 代码 中 使 用 eval 可 能 引起 安全 问题 ， 因 此 
不 要 使 用 它 。 他 们 (基本 上 ) 是 对 的 , 使 用 eval 时 应 当 非 常 小 心 , 但 他 们 说 的 是 另 一 种 形式 的 eval, 有 时 被 称 作 “eval of string.” 
如 果 关 键 字 后 面 紧 接着 的 是 花 括 号 括 起 来 的 代码 块 ， 如 我 们 这 里 的 ， 则 没有 必要 担心 eval 的 安全 问题 。 





































































































16. 2 使 用 grep 在 列表 得 到 元 素 


有 时 只 需要 列表 中 的 某 些 项 。 例 如 只 需要 数字 列表 中 的 奇数 ， 或 者 文本 中 提 到 Fred 的 行 。 如 你 在 本 节 中 将 看 到 的 ， 可 以 使 
j grep 从 列表 中 得 到 某 些 项 。 












































让 我 们 来 尝试 第 一 个 ;从 一 个 大 的 数字 列表 中 得 到 其 中 的 奇数 。 这 里 不 需要 使 用 什么 新 的 方法 : 
my @odd_numbers; 


foreach (] .. 1000) { 
push @odd_numbers, $_ ,ifE$_ 2% 2; 
} 

















这 段 代 码 使 用 了 模 运 算 (%)， 在 第 二 章 中 介绍 过 。 如 果 数 字 是 偶数 ， 则 “ 模 2” 运 算 的 结果 是 0， 为 false; 如 果 是 奇数 则 得 
到 1， 为 tue， 因 此 只 有 奇数 才 会 被 存 入 数组 中 。 

















除了 有 些 长 以 及 执行 时 间 也 较 长 外 ， 上 述 代码 没有 任何 问题 。 由 于 上 述 原 因 ，Perl 提供 了 grep 操作 : 














my @odd_numbers = grep {$_ 匈 2}1..1000; 





上 面 一 行 代 码 即 得 到 500 个 奇数 。 它 是 怎样 工作 的 呢 ? grep 第 一 个 参数 是 一 个 块 ， 其 中 $_ 依 次 为 列表 中 的 每 一 个 值 ， 返 回 
一 个 Boolean(true/false) 值 。 剩 下 的 参数 是 相应 的 列表 。grep 会 首先 计算 表达 式 的 值 ， 这 和 foreach 循环 一 致 。 如 果 块 中 最 后 
一 个 表达 式 的 返回 值 为 true， 则 这 个 元 素 会 被 返回 。 

































































当 grep 运行 时 ，$_ 会 被 设 为 列表 中 的 值 ， 一 个 接 一 个 。 你 已 经 在 foreach 循环 中 见 过 这 种 操作 了 。 通 常 在 grep 表达 式 内 部 
修改 $ 的 值 是 一 个 坏 主 意 ， 因 为 这 会 破坏 原始 的 数据 。 








grep 和 一 个 传统 的 Unix 工具 同名 ， 后 者 将 文件 中 匹配 上 正则 表达 式 的 行 找 出 来 。 我 们 也 可 以 使 用 Perl 的 grep， 它 的 功能 
更 强大 。 下 面 是 我 们 将 出 现 fred 的 行 提 取出 来 ; 
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my @matching_lines = grep {Abfred\bHi} <FILE>; 














grep 还 有 一 个 更 简单 的 用 法 。 如 果 表 达 式 很 简单 (而 非 一 个 整 块 )， 则 可 以 使 用 这 个 表达 式 ， 后 接 去 号 4 ) ， 去 号 在 花 括 号 的 
位 置 。 下 面 是 这 种 简单 的 方法 : 




















my @matching_lines = grep Abfredb/i, <FILE>; 


16. 3 使 用 map 对 列表 项 进行 变换 











另 一 个 通常 的 操作 是 ， 转 变 列表 项 的 格式 。 例 如 ， 假 设 你 想 将 一 列 数字 按照 货币 数字 的 格式 输出 ， 如 第 十 三 童 的 子 程序 
&big_money。 我 们 不 想 修 改 原 始 数据 ， 只 想 修 改 一 份 揽 贝 的 进行 输出 。 下 面 是 一 种 方法 ; 




















my @data = (4.73, 1.3, 2, 1234, 0.9436, 12345078.9, 29.953 ); 
my @formatted_data; 


foreach (@data) { 
push @formatted_data,  @big_money($ _); 
} 





这 和 本 章 中 介绍 grep 开头 处 的 例子 类 似 ， 不 是 吗 ? 蔡 换 部 分 的 代码 和 grep 这 个 例子 中 的 代码 非常 相似 ; 


my @data = (4.7$, 1.3, 2, 1234, 6.9456, 12343678.9, 29.95); 
my @formatted_data= map {&big_money($_)} @data; 


map 操作 和 grep 非常 类 似 ， 因 为 它们 有 相同 类 型 的 参数 : 一 个 使 用 $_ 的 块 ， 以 及 一 列 需 要 处 理 的 元 素 。 它 们 处 理 的 方式 也 
是 类 似 的 ， 首 先 根据 列表 中 的 元 素 对 块 的 值 进行 判断 ， 每 一 次 $_ 被 赋予 新 的 列表 中 的 值 。 但 使 用 块 中 最 后 一 个 表达 式 的 值 
的 方法 是 不 同 的 : 不 是 返回 一 个 Boolean 值 ， 而 是 最 终 值 作为 返回 的 结果 人 争 。 任 何 的 grep 或 map 语句 均 可 以 用 foreach 循 
重新 书写 ， 每 一 次 将 结果 元 素 放 入 一 个 临时 数组 中 。 但 短 的 方式 通常 更 有 效 以 及 方便 。 由 于 map 或 grep 的 结果 是 列表 ， 
因此 它 可 以 直接 传递 给 妃 一 个 函数 。 因 此 我 们 可 以 将 格式 化 后 的 货币 数字 打印 出 来 ， 这 些 值 是 被 缩 进 的 : 










































































要 的 不 同 之 处 在 于 ，map 所 用 的 表达 式 是 在 列表 context 中 被 求 值得 ， 因 此 可 以 返回 任意 数量 的 元 素 ， 而 并 非 一 次 一 个 。 











急 刀 一 个 



































Print “The money numbers are\n ， 
map { Sprintf(“9%62SsSm”, $_) } @formatted_data; 





我 们 可 以 一 次 对 它 进 行 处 理 ， 而 不 使 用 临时 数组 @formatted_data: 





my @data = (4.73, 1.3, 2, 1234, 0.9456, 12345678.9, 29.95); 
print “The money numbers are\n ， 
map {sprintf(%25s\m” &big_money($ ))} @data; 





同 在 grep 见 到 的 一 样 , map 也 有 更 简单 的 使 用 法 。 如 果 表 达 式 很 简单 (而 非 一 个 整 块 ), 则 可 以 使 用 这 个 表达 式 , 后 接 运 号 (, )， 
去 号 在 花 括号 的 位 置 : 
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Print “Some powers of two are\n ， 
map At (2 4 和) An 0..15; 


16. 4 不 用 双 引 号 的 hash keys 


Peal 为 程序 员 提 供 了 许多 的 简便 方法 ， 例 如 省 略 掉 某 些 hash keys 上 的 双 引 号 。 




















不 能 省 略 抒 每 一 个 key 上 的 引号 ， 因 为 hash key 可 以 是 任意 的 字符 串 。 但 大 多 时 候 keys 是 非常 简单 的 。 如 果 hash key 只 由 
字母 ， 数 字 ， 下 划 线 ， 以 及 不 由 数字 开头 组 成 ， 则 可 以 省 略 掉 引 号 。 这 些 没有 引号 的 简单 字符 串 被 叫做 pareworad。 





























允许 使 用 这 种 简写 的 一 个 地 方 ， 也 是 hash key 各 出 现 的 地 方 ， 是 在 花 括号 中 引用 hash 元 素 。 例 如 $score{f 'fred”}， 也 可 以 写 
做 $score{ffred} 。 由 于 许多 的 hash key 是 这 种 类 型 , 不 使 用 引号 将 非常 方便 。 但 注意 : 如 果 花 括号 里 面 的 不 仅仅 是 parewora， 
Pezl 将 会 把 它 当 作 表 达 式 来 处 理 。 


















































另 一 个 hash keys 常 出 现 的 地 方 是 , 使 用 key/value 对 hash 赋值 的 时 候 。 大 箭头 (=>) 在 key 和 value 之 间 是 非常 有 用 的 因为 (如 
果 key 是 bareword) 大 箭头 为 你 起 了 引号 的 作用 : 


























#Hash 中 包含 了 bowling 的 成 绩 


Imy %Score = ( 


barney => 194， 
fred ,三 > 205; 
dino => 30， 


); 





























这 是 大 箭头 和 逗号 一 个 重要 的 不 同 地 方 ， 大 箭头 左边 的 bareword 暗含 着 是 由 引号 括 起 来 的 。( 而 右边 的 则 没有 。) 大 箭头 的 
这 个 性 质 不 仅仅 是 针对 hash 的 ， 虽 然 这 是 最 常 使 用 的 地 


16. SSlices 

















通常 ， 我 们 只 需 处 理 列表 中 的 部 分 元 素 。 例 如 ，Bedrock 图 书馆 的 例子 中 ， 我 们 在 一 个 大 文件 中 保存 了 其 赞助 者 的 信息 争 。 
文件 的 每 一 行 包含 赞助 者 的 由 有 去 号 分 隔 开 的 6 项 信息 : 姓名 ， 图 书 卡号 ， 住 址 ， 家 庭 电 话 号 码 ， 工 作 住宅 电话 ， 当 前 借 出 
的 书 数 。 文 件 的 一 部 分 内 容 如 下 : 







































































争 这 因 该 是 个 功能 齐全 的 数据 库 ， 而 不 仅 是 一 个 文件 。 他 们 计划 在 下 个 冰河 世纪 后 再 更 新 的 系统 。 














fred flintsone:21608:301 Cobblestone Way:933-1212:333-2121:3 
barney rubble:709918:3128 Granite Blvd:333-3333:553-3438:0 








这 个 图 书馆 的 一 个 应 用 需要 图 书 卡号 ， 以 及 借 出 的 书目 ， 不 需要 其 它 的 数据 。 可 以 使 用 如 下 代码 ， 来 得 到 这 些 数据 ; 














while (<FILE>) { 
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chomp; 
my @items = Split /:/; 
my($card_num, $countb = ($items[1], $items[S]); 
# 现 在 使 用 这 两 个 变量 
} 





之 后 ， 数 组 @items 就 用 不 上 了 ， 这 看 起 来 是 一 种 浪费 争 。 将 结果 赋值 给 一 个 列表 也 许 更 恰当 ， 如 下 : 























急 这 不 是 特别 的 浪费 。 上 面 所 出 现 的 技术 ， 是 那些 不 知道 slices 的 程序 员 常 用 的 ， 将 它们 写 在 这 里 是 为 了 便于 比较 。 



































my($name, $card_num, $addr $home, $work, $count) = Split /:/; 





上 述 方法 避免 了 使 用 数组 @items， 但 现在 又 多 了 四 个 不 需要 的 标量 变量 。 对 于 这 种 情况 ， 一 些 程序 员 习 惯 使 用 一 些 虚 拟 的 
变量 名 ， 如 $dummy_1， 表 明 他 们 并 不 关心 split 中 的 相应 元 素 。Larry 认为 这 也 会 有 很 多 问题 ， 因 此 他 加 入 了 undef 的 特殊 
用 法 。 如 果 将 列表 的 一 个 元 素 被 赋 给 undef， 则 意味 着 忽略 此 元 素 : 











my(undef, $card_num, undef undef undef, $count) = SPplit /:/; 








看 起 来 好 些 了 吗 ? 其 优点 是 不 需要 一 些 不 必要 的 变量 名 。 其 缺 
如 果 列 表 中 的 元 素 很 多 ， 这 将 带 来 巨大 的 麻烦 。 例 如 ， 某 些 人 








点 是 需要 知道 有 几 个 undef， 才 知道 哪 一 个 元 素 赋 给 $count。 
只 需要 stat 中 的 mtime 值 ， 其 代码 如 下 : 





my(undef, undef, undef, undef, undef, undef, undetf， 
undef, undef, $mtime) = stat $some _file; 





如 果 使 用 了 错误 个 数 的 undef， 则 可 能 得 到 atime 或 ctime 等 的 值 ， 而 这 很 难 调试 。 还 有 一 种 更 好 的 方法 ，Penl 可 以 对 一 个 
列表 做 索引 ， 就 像 数 组 一 样 ， 即 1zst slice。 由 于 mtime 是 stat 返回 列表 中 的 第 九 个 元 素 争 ， 因 此 我 们 可 以 使 用 下 标 得 到 : 


















































争 它 是 第 十 个 元 素 ， 但 由 于 索引 值 从 0 开始 ， 因 此 其 索引 号 为 9。 这 和 数组 的 情况 是 一 致 的 。 




















my $mtime = (Stat $some_file)[9]; 








轴 


2 


表 元 素 上 的 括号 是 必须 的 〈 这 里 是 ，stat 的 返回 值 )。 像 下 面 这 样 书写 是 不 对 的 : 





my $mtime = stat($some_file)[9]; # 语 法 错误 ! 





list slice 括号 后 必须 有 一 个 由 方 括号 括 起 来 的 的 下 标 表 达 式 。 





回 到 Bedrock 图 书馆 的 例子 ， 使 用 的 列表 是 split 的 返回 值 。 我 们 利用 slice 将 元 素 1 和 元 素 5 取出 : 





my $card_num = (Split /:/])[H]; 
my $count = (Split /:/)[S]; 








使 用 像 这 样 的 scalar-context slice 〈 一 次 得 到 列表 中 的 一 个 元 素 ) 没什么 不 可 以 的 ， 但 如 果 只 使 用 split 一 次 将 更 简单 有 效 。 
因此 让 我 们 一 次 中 完成 。 在 list context 中 使 用 list slice， 可 以 一 次 将 所 有 值 取 出 : 
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my($card_num, $countb = (Split /:])[15]; 


上 述 索引 值 将 元 素 1 和 元 素 5 从 列表 中 取出 ， 将 它们 按照 2 个 元 素 的 列表 值 返回 。 它 们 被 赋值 给 两 个 my 变量 ， 其 结果 正 
是 我 们 所 需 的 。 这 里 上 只 用 了 一 次 slice， 但 使 用 了 一 个 简单 表达 式 给 两 个 变量 设 值 。 














slice 通常 是 将 一 些 元 素 从 列表 中 取出 的 最 简单 方法 。 下 面 ， 我 们 将 列表 的 第 一 个 元 素 ， 最 后 一 个 元 素 取 出 ， 你 需要 知道 -1 
表示 最 后 一 个 元 素 争 : 





















































急 将 列表 排序 ， 以 找到 其 极 值 元 素 ， 不 是 最 有 效率 的 方法 。 但 Perl 的 排序 非常 快 ， 


六 








此 元 素 个 数 在 


As 


1L 百 以 内 这 种 方法 也 是 可 以 取 的 。 

















my($first $lasb = (Sort @names)[0, -1]; 


slice 的 下 标 可 以 是 任意 的 序列 ， 甚 至 可 以 是 重复 的 。 下 例 将 具有 十 个 元 素 的 列表 中 的 五 个 元 素 取 避 





上 二 


my Q@names = dqw{ zero one two three four five Six Seven eight nine }; 
my Q@numbers = ( @names)[ 9, 0, 2, 1, 0 ]; 
print “Bedrock @numbers \m; # 输 出 Bedrock nine zero two one zero 


16. 5. 1 Array Slice 


























全 


前 面 的 例子 可 以 更 简单 一 些 。 当 使 用 silce 从 数组 得 到 元 素 时 〈 和 list 相应 )， 括 号 是 不 需要 的 ， 因 此 可 以 如 下 这 样 : 











| 
一 








my Q@numbers = @numbers[ 9, 0, 2, 1, 0 ]; 

















这 不 仅仅 是 省 略 掉 括 号 的 问题 ， 还 是 一 种 访问 数组 元 素 的 不 同方 法 : array slice。 在 第 三 童 中 ， 我 们 说 @names 前 面 的 @ 标 
记 表 示 “ 所 有 的 元 素 。” 实 际 上 ， 在 语言 学 意义 上 ， 这 更 像 一 个 复数 的 标记 ， 如 cats” “dogs" 的 的 “符号 。 在 Perl 中 ， 美 元 
是 一 列 元 素 。 











符号 鸣 表 示 这 里 是 一 个 元 素 ， 但 @ 符 号 表示 这 






































slice 总 是 列表 ， 因 此 array slice 使 用 @ 标 记 来 表示 它 。 当 你 在 Perl 程序 中 见 到 @names[ .… ]， 你 需要 像 Perl 那样 ， 碍 看 开头 
处 的 @ 符 号 ， 以 及 结尾 处 的 方 括号 (个 )。 方 括号 的 含义 是 给 数组 元 素 作 索引 ， 而 @ 符 号 表示 得 到 整个 列表 银 值 。 美 元 符号 ($) 
表示 一 个 元 素 。 参 见 图 16-1。 














争 当 我 们 说 “这 个 列表 时 ” 并 不 意味 着 有 多 个 元 素 ， 也 可 能 为 空 。 





16-1 数组 slices 和 单个 元 素 
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O11e ele11ze11t 
$name[...] 
Jromz da12 Q1TQD 
Q@names[...] 
QUstoreremze1zts 


变量 前 的 符号 〈$ 或 @ 符 号 ) 雇 定 了 下 标 表 达 式 的 context。 如 果 前 面 是 $ 符 号 ， 则 下 标 表达 式 是 在 标量 context 中 被 求人 
到 一 个 索引 值 。 如 果 之 前 为 @ 符 号 ， 则 下 标 表 达 式 在 列表 context 中 被 求 值 ， 得 到 一 列 索引 值 。 


























SN 


磋 







































































因此 @name[2, 5] 的 含义 同 ($names[2], $name[S$]) 一 样 。 如 果 想 得 到 这 个 列表 的 值 ， 可 以 使 用 array slice。 任 何 你 想 用 列表 的 
地 方 ， 均 可 以 使 用 array slice 。 
































有 个 地 方 只 有 slice 可 以 使 用 ， 但 list 不行: slice 可 以 在 数组 中 以 内 插值 被 蔡 换 : 








my Q@names = dqw{ zero one two three four five Six Seven eight nine }; 
Print “Bedrock @names[9, 0, 2, 1 0]\n ; 











如 果 对 @names 内 插 ， 将 得 到 数组 中 的 所 有 元 素 ， 由 空格 分 开 。 如 果 对 @names[9, 0, 2, 1,0] 内 插 ， 它 只 得 到 数组 中 的 相应 
元 素 ， 也 由 空格 分 开 争 。 让 我 们 再 回 到 Bedrock 岁 书 馆 的 例子 中 ， 也 许 我 们 的 程序 需要 更 新 赞助 者 文件 中 MrSlate 的 地 址 
以 及 电话 号 码 ， 因 为 它 搬 到 了 Hollyrock 山 的 一 个 更 大 住处 去 了 。 如 果 在 @items 中 有 他 的 信息 ， 我 们 可 以 像 下 面 这 样 做 ， 

来 更 新 这 两 个 元 素 的 信息 : 













































































镶 更 准确 的 说 ， 列 表 的 这 些 元 素 被 Perl 的 4 变量 的 值 隔 开 ， 其 默认 值 为 空格 。 不 因 该 改变 其 值 。 当 内 插值 时 ，Perl 内 部 会 作 join $" @list， 
其 中 @list 表示 列表 表达 式 。 


























my $new_home_phone =“S55-6099”; 
my $new_address =“99380 Red Rock West”; 
@items[2, 3] = ($new_address, $new_phone_phone); 











再 一 次 提醒 ， 使 用 array slice 使 代码 看 起 来 更 紧凑 。 在 上 例 中 ， 最 后 一 行 也 可 以 写 做 ($items[2], $items[3] )， 但 前 者 更 紧凑 
和 有 效 。 





16. 5. 2Hash Slice 


除了 array slice， 我 们 也 有 pasjp slice。 可 以 对 hash 使 用 slice。 还 记得 三 人 去 打 保 龄 球 的 例子 中 ， 我 们 将 他 们 的 成 绩 记 录 在 
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%score 这 个 hash 中 吗 ? 我 们 既 可 以 使 用 hash 元 素 的 列表 来 得 到 他 们 的 成 绩 ， 也 可 以 使 用 slice 。 这 两 种 技术 是 等 价 的 ， 虽 
然 第 二 种 更 简单 效率 : 





my @three_score = ($score{'barney”}, $score{f fred”}, $score{ dino”]); 
my @three_Scores = @Sscore{ qwW/ barney fred dino/ }; 
































slice 总 是 列表 ， 因 此 hash slice 总 是 使 用 @ 符 号 来 表示 争 。 当 在 Perl 程序 中 见 到 @score{ … }， 你 需要 像 Perl 那样 ， 查 看 开 
头 处 的 @ 符 号 ， 以 及 结尾 处 的 花 括号 ([))。 方 括号 的 含义 是 给 hash 的 元 素 人 索引， 而 @ 符 号 表示 得 到 整个 列表 争 值 。 美 元 
符号 9) 表 示 一 个 元 素 。 参 见 图 16.2 。 





























急 这 看 起 来 像 重 复 ， 我 们 只 是 想 强调 hash slices 和 array slices 是 类 似 的 。 如 果 你 不 这 样 认 为 ,但 我 们 确实 是 想 强 调 hash slices 和 array slices 
是 类 似 的 。 








同 array slice 一 样 ， 变 量 前 的 符号 ($ 或 @ 符 号 ) 决定 了 下 标 表达 式 的 context。 如 果 前 面 是 $ 符 号 ， 则 下 标 表达 式 是 在 标量 
context 中 被 求 值 ， 得 到 一 个 值 争 。 如 果 之 前 为 @ 符 号 ， 则 下 标 表达 式 在 列表 context 中 被 求 值 ， 得 到 一 列 值 。 




































































急 这 里 有 一 个 例外 ， 但 很 难 遇 到 ， 因 为 在 当今 的 Penl 代码 中 ， 很 少 使 用 它 。 参 见 perlvar 的 用 户 手册 关于 $; 的 部 分 。 





当 我 们 谈论 hash 时 ， 猜 想 为 什么 没有 百 分 号 ( 哆 是 很 正常 的 。 这 个 标记 表明 整个 hash;， hash slice( 如 别 的 slice) 总 是 jist 而 非 
hash 争 。 在 Perl 中 ， 美 元 符号 ($) 指 单个 元 素 ，@ 符 号 表示 有 一 列 值 ， 而 百 分 号 表示 整个 hash。 





























图 16-2 Hash slices 和 单个 元 素 





O11C Ele111e12t 





$score{ ...} 





Jropaz ud 1asy7 





Q@score{...} 





QUstoreremzemts 





由 


争 hash slice 是 一 个 slice( 而 非 hash)， 如 同 house fire 是 指 fire〈 而 非 house)， 而 fire house 是 指 house( 而 非 fre)。 大 致 如 此 。 





如 在 array slices 中 见 到 的 ; hash slice 可 以 替代 相应 的 hash 列表 元 素 。 因 此 ， 可 以 按 如 下 的 方法 给 我 们 的 朋友 的 保龄球 计 分 
(不 需要 hash 中 的 别 的 元 素 ): 





my @Pplayers = dqwW/ barney fred dino /; 
my @bowling_scores = (193, 203, 30); 
@score{ @players } = @bowling_scores; 
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最 后 一 行 和 ($score{“barney}, $scoref'fred”], $score{“dino) 的 作用 是 一 样 的 。 





hash slice 也 是 可 以 被 内 搬 。 下 面 ， 我 们 打印 蝇 





Print “Ionights players were: @players\nm ; 


Print “There Score were: @score{players }\n 


16. 56 练习 


我 们 最 喜欢 的 保龄球 手 的 成 绩 ; 


》 


1. [30] 写 一 个 程序 ， 从 文件 中 读 入 字符 串 ， 一 行 一 个 字符 串 ， 然 后 让 用 户 输入 模式 ， 这 个 模式 可 能 匹配 上 菜 些 字符 串 。 对 
于 每 一 个 模式 ， 程 序 将 指出 文件 中 有 多 少 个 字符 串 《〈《 多 少 行 ) 匹配 上 了 ， 并 指出 是 哪些 。 对 于 新 的 模式 不 需要 重新 读 文件 ， 
将 这 些 字符 串 保 留 在 内 存 中 。 文件 名 可 以 直接 写 在 程序 之 中 。 如 果 模 式 无 效 〈 例 如 ， 圆 括号 不 匹配 )， 则 程序 报告 这 个 错误 ， 









































并 让 用 户 继续 尝试 新 的 模式 。 当 用 户 输 入 一 个 空 行 ， 则 程序 退出 。 
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练习 题 答 案 


答案 略 ， 如 果 需 要 请 不 要 向 译 者 索取 @。 本 书 英 文 厂 有 答案 ， 这 个 建议 是 免费 的 《〈 译 者 注 )。 
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